摘要:
大模型训练 https://huggingface.co/spaces/nanotron/ultrascale-playbook?section=high_level_overview 大模型推理加速 https://www.53ai.com/news/finetuning/202407110928
阅读全文
posted @ 2025-04-27 16:54
bregman
阅读(4)
推荐(0)
摘要:
去掉重复, 以及开头的冒号 export LD_LIBRARY_PATH=
(echoLD_LIBRARY_PATH | awk -F: '{for(i=1;i<=NF;i++) if(!a[
i]++) printf(i>1?":%s":"%s"),i}' | sed 's/^://') e
阅读全文
posted @ 2025-04-02 14:18
bregman
阅读(1)
推荐(0)
摘要:
socket 代理使用 安装 brew install proxychains-ng 配置 $ tail -n 3 /opt/homebrew/etc/proxychains.conf #socks4 127.0.0.1 9050 socks5 127.0.0.1 <端口> 使用 # pkill p
阅读全文
posted @ 2025-02-14 15:46
bregman
阅读(42)
推荐(0)
摘要:
镜像制作 注意 mac 最近的芯片都是arm64架构, 而Linux一般都是 amd64架构 创建 Dockerfile 文件 # FROM ubuntu # 使用阿里云 alinux3 FROM alibaba-cloud-linux-3-registry.cn-hangzhou.cr.aliyu
阅读全文
posted @ 2025-02-11 10:35
bregman
阅读(21)
推荐(0)
摘要:
https://github.com/deepseek-ai/awesome-deepseek-integration/blob/main/docs/zotero/README_cn.md 一开始用curl调用一直没反应, 加了 -k 后可以。 然后去掉-k 也可以 curl https://api
阅读全文
posted @ 2025-02-06 11:03
bregman
阅读(107)
推荐(0)
摘要:
https://www.modelscope.cn/models/unsloth/DeepSeek-R1-Distill-Qwen-32B-GGUF/summary 下载llama-cli https://github.com/ggerganov/llama.cpp/releases 利用model
阅读全文
posted @ 2025-02-05 21:21
bregman
阅读(315)
推荐(1)
摘要:
token生成 代码 transformers.generation.GenerationMixin.generate 文档资料 机器如何生成文本? https://cloud.tencent.com/developer/article/1620772 NLP的巨人肩膀 https://zhuanl
阅读全文
posted @ 2025-02-05 15:37
bregman
阅读(29)
推荐(0)
摘要:
使用Python内置的 pdb 模块 描述: pdb 是Python的内置调试器,可以逐行执行代码,检查变量,设置断点等。 使用方法: import pdb pdb.set_trace() python在你想开始调试的地方插入 pdb.set_trace(),程序会在这里暂停,进入调试模式。 常用命
阅读全文
posted @ 2024-12-29 08:42
bregman
阅读(35)
推荐(0)
摘要:
阅读了快手的论文 MARM,论文中的算法 符号看起来不容易理解。 对照图自己研究了下, 理解了。 需要知道为什么(b) 和(c) 中 的中间结果是相同的。需要知道 masked-self-attention 缓存是怎么处理,看箭头 快手 MARM: Unlocking the Future of R
阅读全文
posted @ 2024-12-24 19:21
bregman
阅读(143)
推荐(0)
摘要:
#!/bin/bash VARIABLE_NAME="HelloWorld" cat <<'EOF' The variable $VARIABLE_NAME should not be replaced. EOF cat <<EOF In this case, we'll escape the do
阅读全文
posted @ 2024-07-23 10:33
bregman
阅读(19)
推荐(0)
摘要:
参考 https://www.cnblogs.com/AndreaDO/p/17854742.html C/C++插件 code runner 插件
阅读全文
posted @ 2024-05-24 17:16
bregman
阅读(9)
推荐(0)
摘要:
尝试恢复 grub 界面 按e 编辑, ro 后加上 splash nomodeset 按快捷键ctl + alt + F1, 或者 ctl + alt + F2 或者 其他 F3可以图形登录 删除nvidia 相关, reboot 后可以登录图形界面 sudo apt-get remove nvi
阅读全文
posted @ 2024-05-13 01:01
bregman
阅读(549)
推荐(0)
摘要:
配置conda代理
cat ~/.condarc # https://help.mirrors.cernet.edu.cn/anaconda/ ubuntu@ubuntu-Z790-UD:/opt cat ~/.condarc channels: - defaults show_channel
阅读全文
posted @ 2024-05-03 15:38
bregman
阅读(29)
推荐(0)
摘要:
#!/usr/bin/env python # -*- encoding:utf-8 -*- import tempfile import sys import os import subprocess import logging import re __all__ = ["run", "quer
阅读全文
posted @ 2024-03-12 10:37
bregman
阅读(7)
推荐(0)
摘要:
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_network Instal
阅读全文
posted @ 2024-03-10 09:10
bregman
阅读(60)
推荐(0)
摘要:
https://help.aliyun.com/document_detail/206889.html
阅读全文
posted @ 2024-01-12 13:56
bregman
阅读(3)
推荐(0)
摘要:
用pytorch 2.2 快了不少 参考 https://pytorch.org/blog/compiling-numpy-code/ 在mac M2 机器上, 快了50%, 但没有好几倍。可能和依赖libomp有关 brew install libomp python test_np.py tes
阅读全文
posted @ 2023-10-23 19:23
bregman
阅读(129)
推荐(0)
摘要:
双样本T检验代码, 对应数学原理 https://online.stat.psu.edu/stat415/lesson/11/11.2 import numpy as np # noqa from scipy import stats from scipy.stats import beta bas
阅读全文
posted @ 2023-10-11 16:17
bregman
阅读(84)
推荐(0)
摘要:
比较pdf差别 https://vslavik.github.io/diff-pdf/ brew install diff-pdf 使用 diff-pdf --view a.pdf b.pdf # or diff-pdf --output-diff=diff.pdf a.pdf b.pdf
阅读全文
posted @ 2023-09-22 14:45
bregman
阅读(175)
推荐(0)
摘要:
### online mirror descent algorithm * 参考 https://tlienart.github.io/posts/2018/10/27-mirror-descent-algorithm/ * 这本书有详细介绍 http://www.cs.cmu.edu/afs/cs
阅读全文
posted @ 2023-09-08 14:25
bregman
阅读(18)
推荐(0)
摘要:
* 行列式
\begin{array}{|cc|} a_1 & a_2 \\\\ b_1 & b_2 \end{array} = a_1b_2 - b_1a_2 的几何意义, 等于下面平行四边形OPGQ的面积. 根据辅助线可以简单证明。 
推荐(0)
摘要:
以下摘自 https://zhuanlan.zhihu.com/p/642693808 * 考虑一个可微函数
f: \mathbb{R}^{n} \rightarrow \mathbb{R}, \operatorname{dom} f=\mathbb{R}^{n} 对某一点 $\left(x_{
阅读全文
posted @ 2023-09-06 14:58
bregman
阅读(1143)
推荐(0)
摘要:
## mintlinux安装docker * 用 Aliyun 代理 ```bash # step 1: 安装必要的一些系统工具 sudo apt update sudo apt -y install apt-transport-https ca-certificates curl software
阅读全文
posted @ 2023-09-02 09:21
bregman
阅读(255)
推荐(0)
摘要:
cgtn https://live.cgtn.com/500/prog_index.m3u8 cgtn doc https://livedoc.cgtn.com/500d/prog_index.m3u8 https://github.com/fanmingming/live/blob/main/tv
阅读全文
posted @ 2023-08-11 15:05
bregman
阅读(196)
推荐(0)
摘要:
* ortools 中提供了一个文档介绍快速具体算法 https://developers.google.cn/optimization/lp/lp_advanced?hl=en 其中实现了一个迭代法 PDLP, 对于低精度,以及给定初值的情况应该比较有利。 文档没有提供例子, 但代码路中有例子:
阅读全文
posted @ 2023-07-26 01:00
bregman
阅读(358)
推荐(0)
摘要:
看到一个github上搭建的博客, 很漂亮, https://adaning.github.io/tags/ 有机会可以搞一个。 参考它上面的提示 Powered by Hexo | Theme Matery
阅读全文
posted @ 2023-07-25 13:09
bregman
阅读(22)
推荐(0)
摘要:
* https://www.microsoft.com/en-us/research/blog/three-mysteries-in-deep-learning-ensemble-knowledge-distillation-and-self-distillation/
阅读全文
posted @ 2023-07-25 11:21
bregman
阅读(34)
推荐(0)
摘要:
ps aux | grep test_streaming.py | sed -E 's/\s+/ /g; $d' | cut -d ' ' -f 2 | xargs -i kill -s 9 {} # linux ps ax | grep netron | sed -r 's/\s+/#/g;/gr
阅读全文
posted @ 2023-07-19 12:28
bregman
阅读(19)
推荐(0)
摘要:
## 固件 * [下载](https://www.123pan.com/s/Q968Vv-MuUK3)解压固件文件, 复制 360f5 1141 那个版本至桌面, ## 方法1. 连网线升级固件步骤(忽略,直接方法2) 1. 固件复制桌面后, 拔掉路由WAN口网线,然后电脑到路由由LAN口连根线,
阅读全文
posted @ 2023-07-03 10:34
bregman
阅读(1293)
推荐(0)
摘要:
* 错误  * 解决方法: 通过和之前可以的任务对比,发现其中有Add dependencies with
阅读全文
posted @ 2023-07-01 05:11
bregman
阅读(653)
推荐(0)
摘要:
```python import time import tensorflow as tf tf.compat.v1.disable_eager_execution() #%% 平均2.7秒。 发现conda 创建tf1.15 速度非常慢,应该环境配置有问题 A = tf.linalg.svd(tf
阅读全文
posted @ 2023-05-16 14:14
bregman
阅读(100)
推荐(0)
摘要:
```python # %% import jax import jax.numpy as jnp import numpy as np def loss(params, r): lambda_a, lambda_s = params return jnp.maximum(r - lambda_a
阅读全文
posted @ 2023-05-13 13:26
bregman
阅读(38)
推荐(0)
摘要:
* 代码 https://github.com/nepluno/lbfgsb-gpu * https://pages.mtu.edu/~struther/Courses/OLD/5630/Refs/StdOpt/Par_L-BFGS-B_CompGraphFei_2014.pdf * jax 下 的
阅读全文
posted @ 2023-05-10 18:50
bregman
阅读(305)
推荐(0)
摘要:
读论文 Sequential Recommendation with Probabilistic Logical Reasoning 中碰到的问题。 结论大概是这样: 对于Beta分布,KL散度的公式为: $$D_{KL}(Beta(\alpha_1, \beta_1)||Beta(\alpha_2
阅读全文
posted @ 2023-04-27 15:31
bregman
阅读(229)
推荐(0)
摘要:
* 命令: sudo ifconfig awdl0 down * 命令原理:注意影响隔空投送功能 此命令关闭的是awdl0网卡, 此网卡被应用于Airdrop, AirPlay等功能, 被苹果默认开启。此网卡开启会极 大影响WIFI, 但是对于电脑用户基本上不需要这些功能, 还有安全风险。 此命令的
阅读全文
posted @ 2023-04-18 17:22
bregman
阅读(714)
推荐(0)
摘要:
 ```bash sudo modinfo vboxdrv sudo rm /lib/modules/5.15.
阅读全文
posted @ 2023-03-19 14:03
bregman
阅读(25)
推荐(0)
摘要:
* https://crfm.stanford.edu/2023/03/13/alpaca.html * https://github.com/archersama/awesome-recommend-system-pretraining-papers * [A Comprehensive Surv
阅读全文
posted @ 2023-03-14 16:43
bregman
阅读(108)
推荐(0)
摘要:
* 阿里妈妈技术 https://blog.csdn.net/alimama_Tech?type=blog * 深度点击率预估模型的One-Epoch过拟合现象剖析 * https://github.com/Z-Y-Zhang/one_epoch_phenomenon * 其他收集网站 https:
阅读全文
posted @ 2023-02-15 10:24
bregman
阅读(33)
推荐(0)
摘要:
 * https://homepages.inf.ed.ac.uk/imurray2/pub/16choldif
阅读全文
posted @ 2023-02-03 13:57
bregman
阅读(32)
推荐(0)
摘要:
* ODS: 操作型数据存储, 基础层 DW数据分层,由下到上为**DWD**,DWB,**DWS**。 - DWD:data warehouse details 细节数据层,是业务层与数据仓库的隔离层。主要对ODS数据层做一些数据清洗和规范化的操作。 - DWB:data warehouse ba
阅读全文
posted @ 2022-12-15 15:38
bregman
阅读(329)
推荐(0)