2025-11-23

SRE 职位要求

SRE 职位要求图片展示

以下图片展示了 SRE 职位的具体要求：

SRE 职位要求图片

2025-11-23

my 1st post

2025-11-23

Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

Quick Start

Create a new post

1	$ hexo new "My New Post"

More info: Writing

Run server

1	$ hexo server

More info: Server

Generate static files

1	$ hexo generate

More info: Generating

Deploy to remote sites

1	$ hexo deploy

More info: Deployment

2025-02-23

扩散模型与热力学扩散定律的关系

🔬 概述：从物理现象到生成式 AI

扩散模型（Diffusion Models, DMs）作为一种前沿的生成式人工智能技术，其核心设计理念直接来源于非平衡态热力学（Nonequilibrium Thermodynamics）和物理学中的扩散现象。

这两者之间的关系并非偶然的命名相似，而是扩散模型在数学和理论上对自然界扩散过程的模仿与逆转。

1. 热力学扩散定律（物理基础）

在物理学和化学中，扩散是一个自发的、趋向于热平衡的弛豫过程。它描述了粒子从高浓度（高化学势）区域向低浓度（低化学势）区域的净迁移。

核心数学描述：菲克定律（Fick’s Laws）

驱动力： 浓度梯度或化学势梯度。
数学模型： 菲克第二定律（Fick’s Second Law）是一个抛物型偏微分方程，它描述了浓度随时间和空间的变化：
$$
\frac{\partial \phi}{\partial t} = D \nabla^2 \phi
$$
其中：
- $\phi$ 是浓度或密度。
- $t$ 是时间。
- $D$ 是扩散系数。
- $\nabla^2$ 是拉普拉斯算子，代表空间上的二阶导数（浓度梯度变化）。
物理意义： 这个方程描述了粒子在布朗运动（随机运动）影响下，密度分布如何随时间趋于均匀（熵增）。

2. 扩散模型（Diffusion Models, DMs）的架构

扩散模型是一类潜变量模型，通过马尔可夫链进行训练，其工作流程分为两个主要阶段，精确地对应了物理扩散过程的正向和逆向。

A. 前向过程（Forward Process / 加噪过程）

目的： 系统地破坏数据结构。
操作： 从一个清晰的数据样本（例如图像 $X_0$）开始，在多个时间步长（T）内，逐步、有规律地添加微小的高斯白噪声。
物理类比： 这模拟了自然界的热力学扩散过程——从有序（清晰图像）到无序（纯噪声）的过程，如墨水滴入水中逐渐弥散。这是一个不可逆的熵增过程。
结果： 在 $T$ 步之后，原始数据完全退化为服从简单高斯分布的纯噪声 $X_T$。

B. 逆向过程（Reverse Process / 去噪过程）

目的： 从纯噪声中重建原始数据。
操作： 训练一个神经网络（通常是 U-Net 架构）来学习并预测前向过程中每一步所添加的噪声，并将其减去。
物理类比： 这相当于学习逆转物理扩散过程——将无序的噪声去噪（去随机化）成有序、连贯的图像。在理论上，这可以看作是反向热力学过程。
结果： 从纯噪声 $X_T$ 开始，通过逐步的去噪，最终生成一个新的、高质量的数据样本 $X_0$。

3. 核心关系：随机微分方程（SDE）

扩散模型和物理扩散定律最深刻的联系在于其数学形式：

物理学： 扩散现象（如布朗运动）通常由朗之万方程（Langevin Equation）或更一般的**随机微分方程（SDE）**来描述。
扩散模型： DMs 的前向加噪过程在数学上正是通过一个离散化的 SDE 或随机马尔可夫链来建模的，其中“噪声项”反映了随机的热力学波动。

理论借鉴：非平衡态热力学

扩散模型的早期和高级研究借鉴了随机热力学（Stochastic Thermodynamics）和非平衡态热力学的原理。

自由能和势能： 在某些理论框架下，生成模型（包括扩散模型）可以被视为在学习数据分布的“自由能”或“势能”景观。扩散和去噪过程则是在这个景观上进行梯度下降或采样的动态过程。
昂萨格倒易关系： 扩散作为一种输运现象，与热力学中的昂萨格倒易关系等概念相联系，为扩散模型提供了严谨的理论基础，例如用于分析生成速度、准确性和热力学耗散（熵产生）之间的权衡关系（即 Speed-Accuracy Trade-off）。

因此，扩散模型是借用物理学中经过严格验证的扩散动力学（一个从有序到无序的熵增过程）作为其加噪框架，然后训练一个深度神经网络来学习该过程的时间逆转，从而实现高效和高质量的数据生成。

2025-01-23

技术分享►学习笔记

使用jupyter lab

选择使用jupyter lab，代替notebook

原因

JupyterLab 是 Jupyter Notebook 的下一代、更现代、功能更强大的替代品。它们都服务于相同的核心目的：通过浏览器提供一个交互式计算环境。

当前遇到的问题

在已经安装jupyter notebook情况下，编辑markdown文件会不方便。

解决方案

1，关闭jupyter notebook

sudo netstat -vantup | grep 8888
kill pid

2, 启动jupyter lab，并指定监听8888端口

nohup jupyter lab –no-browser –port=8888 –ip=0.0.0.0 –allow-root &

2025-01-23

技术分享►学习笔记

ssh port 22 connection refused

这是你的正文内容

你可以在这里开始用 Markdown 语法撰写文章内容。

链接示例

加粗文字示例
在aws ec2上部署实例后ssh无法连接问题
症状：
1，从国内主机上ssh hostname，Connection closed by xx.xx.xx.xx port 22，或kex_exchange_identification: Connection closed by remote host
解决办法：
在ec2实例上将ssh监听端口从22改成其他，如23456，然后重新连接就好了。

2025-01-20

技术分享►学习笔记

git上传大文件报错问题

这是你的正文内容

你可以在这里开始用 Markdown 语法撰写文章内容。

链接示例

加粗文字示例

下面这个命令好用，可以彻底从所有提交历史中移除大文件

git filter-branch –force –index-filter ‘git rm –cached –ignore-unmatch .terraform/providers/registry.terraform.io/aliyun/alicloud/1.200.0/linux_amd64/terraform-provider-alicloud_v1.200.0’ –prune-empty –tag-name-filter cat – –all

下面这个命令不好用：

git filter-repo –path .terraform/ –invert-paths

2024-10-12

技术分享►学习笔记

阿里云上的ssh登陆和用户管理

ssh登陆

创建实例的时候，直接绑定ssh key，后续用pem或ppk格式的private key登陆实例。

目前不再支持用户名/密码登陆方式

默认用户有密码吗？

Ubuntu 官方镜像在阿里云上默认使用 ubuntu 用户登录。
该用户默认没有设置密码，但被配置为可通过 sudo 免密码执行命令（通过 /etc/sudoers 中的配置，通常是 ubuntu ALL=(ALL) NOPASSWD:ALL）。
因此，即使没有密码，你依然可以正常运行 sudo 命令，不会遇到障碍。

是否推荐设置密码？

不推荐设置密码的情况（推荐做法）：

如果你只通过 SSH 密钥认证访问实例（这是最佳安全实践），
并且不需要通过密码登录（如控制台 VNC、本地终端等），
那么不需要为 ubuntu 用户设置密码。
保持无密码状态可以减少暴力破解风险（即使攻击者知道用户名，也无法用密码登录）。

sshd配置文件中设置

——vi /etc/ssh/sshd_config

To disable tunneled clear text passwords, change to no here!

PasswordAuthentication no
PermitEmptyPasswords no

可以考虑设置密码的情况：

你需要通过阿里云控制台的 VNC 或 Web Shell（比如 ECS 实例连接管理终端）进行登录 —— 这些方式可能要求用户密码。
你计划使用 su、sudo -S 或某些脚本/工具依赖用户密码进行身份验证。

建议做法

保持默认：不为 ubuntu 用户设置密码。
确保 SSH 密钥安全保管。
如需控制台登录，可临时设置密码，操作完成后可删除（passwd -d ubuntu），但需注意某些系统可能不允许无密码用户登录控制台。

2024-01-13

技术分享►学习笔记

在同一主机上部署多个服务时的环境隔离问题

问题：在同一个ubuntu系统上部署多个服务，以来的环境版本可能不同，怎么办？

设置不同的环境

（一）按照语言不同配置不同的环境

python语言的环境隔离

env/virtualenv

python3 -m venv ~/envs/jupyter_env
source ~/envs/jupyter_env/bin/activate
pip install jupyterlab

conda

conda create -n jupyter_env python=3.10
conda activate jupyter_env
conda install jupyterlab

node.js语言的环境隔离

nvm(

nvm install 18
nvm use 18
npm install -g hexo-cli
cd /path/to/hexo-site
npm install

（二）使用docker进行隔离

每个服务打包成独立容器，完全隔离运行时、依赖、网络等。

为 Hexo 创建 Dockerfile（基于 Node 镜像）

为 Jupyter Lab 创建 Dockerfile（基于 Python 镜像）

使用 docker-compose.yml 统一管理：

version: ‘3’
services:
hexo:
build: ./hexo-site
ports:
- “4000:4000”
jupyter:
build: ./jupyter-config
ports:
- “8888:8888”

（三）使用系统级用户隔离（较粗糙但简单）

为每个服务创建独立系统用户，配合各自环境变量和家目录。
sudo useradd -m hexo_user
sudo useradd -m jupyter_user
然后分别以不同用户登录或 sudo -u 运行服务，各自管理自己的 Node/Python 环境。
适用于不想用容器但希望避免全局污染的场景。

（四）使用 Podman（Docker 的无守护进程替代）

与 Docker 类似，但更轻量、无需 root，适合桌面或安全要求高的环境。

（五）使用 systemd-nspawn 或 LXC（轻量虚拟机）

比 Docker 更重，但提供接近完整系统的隔离。一般用于需要内核级隔离但又不想开完整 VM 的场景。

用 Hexo 部署博客，且同时运行 Jupyter Lab 做数据分析，nvm + conda + Docker 是一个稳健组合。