Henge Lucy

扩散模型的基本原理

arXiv:2510.21890 摘要 本书聚焦于让扩散模型发展的基本原理,追溯其起源,并展示扩散模型的不同形式如何源于共同的数学思想。 扩散模型首先通过指定一个前向破坏过程,逐步将数据转化为噪声。该前向过程通过定义一系列的中间分布,将数据分布与简单的噪声分布联系起来。扩散模型的核心目标是构建另一个反向过程,该过程将噪声转换为数据,同时恢复前向破坏过程中定义的相同中间分布。 我们描述...

Ubuntu 服务器管理员指南

组内目前新到了几台 GPU 服务器,被分配去当其中一台的管理员。因为从来没当过管理员(之前只是在一些服务器上拥有 sudo 权限辅助管理),所以记录一下管理服务器的探索过程。 1 安装基础软件 需要管理员负责安装的软件分为两种: tmux、htop 这样较为基础的 docker、toolkit 这种较为困难的 1.1 基础软件 基础软件目前安装的有 tmux、git、c...

现代文生图模型能否作为可靠的训练数据生成工具

T2I 模型生成的图像在实际下游任务中的表现究竟如何?作者讨论了“使用不同的 T2I 模型生成的数据训练分类器,对真实数据进行分类”这一下游任务,通过评估分类 ACC 来思考现代 T2I 模型作为可靠训练数据生成器的能力。 arXiv:2602.19946 1 合成数据 使用先进的 T2I 模型生成的图像数据可以被称为“合成视觉数据(Synthetic Vision Data)”。合成...

基于 Paillier 同态加密的投票系统

密码学课程作业,虽然并不是密码学领域的,浅浅学习一下,了解了一下最简单的 Paillier 算法。 1、密钥生成 1.1 生成公钥 系统首先选择两个独立的大素数 $p$ 和 $q$,计算其乘积 $n=p \times q$ 。 大素数:十进制下长度达到数百位的素数 。在数学上,把两个大素数相乘极其容易,但想要把公开的 $n$ 重新拆解回 $p$ 和 $q$(也就是大数分解难题)...

利用 github.io 搭建个人博客

自上研已经过去半年有余,愈发感觉与课题组同门的差距,同时状况颇多,糟心事接连不断。遂下定决心搭建个人博客,一个是记录自己读研期间阅读的一些论文笔记,同时记录一下技术类工作中遇见的各种问题以及是如何解决的,其次是为了记录自己的生活,在无人倾诉的时候给自己一个输出口。 搭建博客的全流程主要是参考的使用 Jekyll + GitHub Pages 搭建个人博客,这位老师的这篇教程其实已经把在 g...