Deepseek在春节档突然在国内引发了一场AI大讨论,不谈技术单就科普价值来说已经很成功了,让很多从未关注AI的人开始关注,讨论,甚至开始学习AI,这事确实很酷, 所以想借此机会也来谈谈学习和研发AI的心得。
都说AI是未来,这话有点耳熟。 “二十一世纪是生物世纪”成就了21世纪的天坑专业。IBM深蓝97年第一次战胜国际大师过去已经27年了, Alphago战胜李世石也过去了8年了,AI还是没有大量进入日常生活被所有人广泛关注。记得Deepmind的CEO Hassabis说他的梦想是找到一种方法,解决所有问题,估计他说这句话的时候是准备做殉道者了,毕竟终其一生也未必实现通用人工智能AGI。
但他是幸运的,就在现在,这个梦想正在一步步照进现实。 2022年chatgpt悄无声息的发布了,零宣传却成为人类历史上增长最快的app。赶上这个时代是我们的幸运,人类上万年的历史中第一次接近创造出超越人类的智能,有人甚至开玩笑说创造出通用智能AGI的不是人而是神。至于Deepseek,不管是否蒸馏,它的出现至少打破了OpenAI的不open,让每个人都有机会自己布署一个有推理能力的AI玩玩,这是今年春节给AI行业最大的新春礼物。
AI究竟是怎么产生的,图灵测试(Turing test)只是告诉我们怎么识别AI,可既然大家开始想参与AI应用和开发,那数学基础是是无法避开的。国内从数学基础上系统又通俗介绍的AI原理的文章比较少,因为简单罗列公式确实是有些枯燥。这里不写公式就谈谈直观的理解,争取从基础上介绍一下AI是怎么工作的。中国有句古话叫知其然要知其所以然,如果不求甚解做AI就只能跟着别人跑。所以know how和know why 都很重要。
1 贝叶斯定理(Bayes' theorem)和激活函数
如果你学过医学或者神经科学,一定会觉得大脑是最神奇的器官。感到神奇不是因为它复杂而是简单。人脑的生理结构一点也不神秘,简单说神经细胞之间的信号传递,神经节之间并没有直接的连接,而是在刺激达到一定阈值后通过突触利用化学介质将信号传递到下一个神经细胞,这个过程叫“激活”。就是这样简单的层层传递竟然形成复杂的智能。
图1: 神经节结构
这背后的原因是什么?回答这个问题之前先要了解一下究竟什么是智能。这里为了简化就把分类作为例子来说明智能的原理。人重要的智能之一是分类,比如小宝宝就会区分妈妈爸爸和陌生人,慢慢长大又学会区分猫猫和狗狗,再后来又会识别各种不同的玩具。分类之所以重要是因为分类是一切逻辑关系的基础,就像我们描述物体的关系首先是要识别出不同的物体。客观世界就是由一个个不同的物体组成的,所以认识客观世界首先就是识别这些物体,这就是分类。分类往往是通过一些特征,比如猫猫会喵喵叫,有爪子会爬树; 而狗狗是汪汪叫,不会爬树会看家。
图2: 叫声外貌这些视听的信号就是我们识别猫狗的依据,也叫特征(Feature)。
特征是如何通过我们刚才说的神经信号层层传导进行分类呢?这里就要引入一个重要的定理,贝叶斯定理。我们之前说了这里不谈公式,所以只是从直觉上感受一下。我们想到猫自然会想到猫叫声,有爪子,会爬树,这些特征反过来定义了猫,所以区分猫和狗或者猫的定义就来源于这些特征。这段话听起来好像是废话,但其实就是这种朴素直观的方式让我们学会了区分客观世界的万事万物: 物体的本体我们是无法定义的,我们只是通过对物体特征的感知进行分类。这其实就是贝叶斯定理的基本思路。比如只区分猫和狗,喵喵叫会爬树,特征值都是1,是猫,反之如果都是0就是狗。
进一步引申一下,比如会爬树是1不会爬树是0,这些可以成为离散特征,1和0之前不存在中间值。但有些特征不是非黑即白,比如狗的平均寿命约是10-13年,猫的平均寿命是12-15年,这些我们称为非离散的特征,要通过具体量化的数字指标进行描述。对于这些连续数据如果我们还用贝叶斯公式去计算,结果就是无法计算全部的数据集合,比如寿命为12.1年和12.2年等。人们希望通过连续的数字特征进行分类,这是一个常见的需求,比如根据化验结果区分不同疾病。这里就要引入其他重要的公式,比如高斯分布(Gaussian distribution)。这里不谈公式确实有点难描述,所以只说结果就是贝叶斯公式加入高斯分布后一部分变得不可计算。这时候就要引入神经网络的概念了,让神经网络给我们自动计算这些不可计算部分,这就是所谓神经网络的训练(Training)。
未完待续,下一部分我们会接触到深度神经网络的部分。
作者简介:
Xiaoqiang Li,现居德国法兰克福,是医学人工智能领域的权威专家。他拥有超过20年在德国医疗软件公司的工作经验,深厚的软件开发背景使其在该领域具有广泛的影响力。
Li先生于2004年获得德国海德堡大学医学信息学硕士学位,早在1997年便已从天津医科大学取得临床医学学士学位,学术背景深厚。
他在AI理论、算法和编程方面拥有深厚的研究底蕴,是这一领域前沿的探索者。Li先生独立开发的AI在线智能问诊软件(https://me-ai.net)展示了他在将人工智能技术应用于医疗实践中的卓越能力。
他的研究成果不仅在实践中得到应用,还获得了学术界的广泛认可。他的一项发明专利——一种故障检测方法及系统(中国专利号:CN103198217),创新性地提出了一种分析现象和原因关系的通用软件算法,该算法利用贝叶斯网络提高了故障检测的准确性,尤其在分析伴随多个相互影响的现象的故障时表现准确而出色。
Li先生在学术研究方面也有杰出表现,作为唯一作者,他所撰写的论文《预测急性肾损伤的深度学习程序》由IOS Press出版,并在《健康技术和信息学研究》期刊上发表(2022年)。该文作为他独立研究的成果,展示了深度学习在预测急性肾损伤中的潜力。值得一提的是,该论文在19th International Conference on Informatics, Management and Technology in Healthcare 2021上被选为优秀论文,并在会议上宣读及接受同行评议。
https://ebooks.iospress.nl/volumearticle/58928
此外,他发表论文的期刊(IOS Press)在2022年谷歌学术出版物全球排名中位列第17,这进一步凸显了Li先生在医学人工智能领域的权威地位和学术影响力。这一排名可在谷歌学术的存档查询中得到验证
https://web.archive.org/web/20221010222502/https://scholar.google.com/citations?view_op=top_venues&hl=en&vq=med_medicalinformatics
总结看来,Xiaoqiang Li凭借其深厚的学术背景、丰富的实践经验以及在医学人工智能领域的突出贡献,无疑确立了他在该领域的权威地位。