中国科学家培育出营养“加强版”水稻,可为人体补充有益心脏的辅酶Q10

中国科学院分子植物科学卓越创新中心辰山科学研究中心陈晓亚院士(右二)和团队成员在田间观察水稻新种质

随着年龄增长,人体自身合成健康所需,尤其是合成心脏健康所需的脂溶性抗氧化剂辅酶Q10的能力逐渐下降,需要额外补充。但水稻等谷物中天然含有的主要是辅酶Q9。近日,中国科学家在农作物营养强化领域取得新突破:培育出一种可以合成辅酶Q10的水稻新种质,吃这种米饭能补充对心脏健康有益的营养物质。

2月14日,相关论文发表在国际权威期刊《细胞》(Cell)上,论文标题为《基于植物进化的辅酶Q10 性状设计》(Design of CoQ10 crops based on evolutionary history)。

该研究由中国科学院分子植物科学卓越创新中心辰山科学研究中心陈晓亚院士团队与中国科学院遗传与发育生物学研究所高彩霞团队等合作完成。

得益于上海辰山植物园丰富的植物资源,研究团队采集了包括苔藓、石松、蕨类、裸子植物和被子植物在内的共67个科134种植物样品。

结合对1000多种陆生植物辅酶Q侧链合成酶Coq1氨基酸序列的进化分析和机器学习,科研团队最终确定了决定链长的5个氨基酸位点。通过精准编辑,研究人员创制了能够主要合成辅酶Q10的水稻。其叶片和籽粒中辅酶Q10占总辅酶Q的75%,籽粒中辅酶Q10达5μg/g,且对水稻产量没有影响。

植物辅酶Q种类的进化和关联氨基酸

论文共同第一作者、上海辰山植物园副研究员许晶晶表示,过往研究表明,辅酶Q10在加热过程中较为稳定,蒸煮不会对其产生影响,油炸会造成少量损失。人们如果日常食用这种新创制的水稻做成的米饭,每天大约可以补充1到2毫克的辅酶Q10。而我们每天从肉类中摄取的辅酶Q10大约为2到3毫克。因此,新创制水稻的辅酶Q10含量已经接近肉类的水平,能够为日常饮食提供有效的营养补充。

上海辰山植物园赵清研究员向澎湃科技表示,他认为该研究师法植物千万年进化规律,找到了改造植物的密码,成功创制了新种,不仅适合辅酶Q的个例,更提供了一种通用的方法论。“合成生物学,就是向大自然学习。”

该研究成果为大数据和人工智能(AI)辅助育种精准改造农作物性状,创造高营养品质农产品,提供了范例。目前,类似研究在小麦中也取得了重要进展

陈晓亚院士团队

545%!DeepSeek公布理论成本利润率

过去一周,DeepSeek连续开放了5个Infra项目的源代码,正当大家以为这场开源盛宴已经结束。3月1日,DeepSeek的彩蛋来了!开源周Day6,DeepSeek官方团队在开发者社区Github和知乎给出了DeepSeek-V3/R1推理系统的技术解读。通过优化吞吐和延迟,DeepSeek理论上一天的总收入达到了562027美元,成本利润率为545%。

敏锐的网友——如MenloVentures投资人Deedy翻译了这意味着什么:“理论ARR(年收入)2亿美元、利润率超过500%,这样的商业效率理应是一家值100亿美元的公司。”

从2024年5月发布DeepSeekV2以来,DeepSeek模型服务就以“价格屠夫”示众,总是比行业其他模型便宜1/10左右,质疑DeepSeek亏本打价格战的声音也一直有。

通过这5天开放源代码以及今天的推理系统概述,这一疑虑也被打消,可以预见,模型推理价格越来越负担得起,且服务提供方也有的赚。这一事件的影响也可以通过社交平台网友展现出刷屏的惊喜得以一窥,“成本利润率545%,等于说你是在告诉我,我被Open AI抢劫了?开源周Day7的彩蛋是 AGI?”

但更大的信号指向生态伙伴,部署DeepSeek有的赚。

一位AI领域的投资人表示,“官方技术解读表明,云平台和上下游通过部署DeepSeek的服务,理论上收益和利润率可以达到很高”。无论是对于提供在线推理、还是私有化部署等服务的供应商,都是利好。

在这波DeepSeek热中受益的云平台硅基流动创始人袁进辉也在第一时间发表了自己的感受,“DeepSeek官方披露大规模部署成本和收益,又一次颠覆了很多人认知。”但需要时间适配DeepSeek V3/R1模型架构,他表示“现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小专家组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间”。

袁进辉进一步指出现在复现这样的推理服务的难度以及DeepSeek可能的战略思考,“幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。这些成果充分体现了DeepSeek团队第一性原理的思考方式和强悍的意志,他们应该是首先是基于某些原因想到了用这样的模型结构,然后发现这样的结构无论是训练还是推理,要做好都有非常大的工程挑战,不过这些问题在他们工程团队来说并不是搞不定的,关键是花那么大力气做完是否有大的收益呢,在最终结果出来前,谁也说不准,他们还是赌了,结果是赌对了。也可能是反过来的,基于系统的出发点设计了这样一个全新的模型结构。”

在DeepSeek官方报告中也提示了DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。配合技术解读,DeepSeek开源周放出的5个代码库带来的影响力才刚刚开始。

《DeepSeek-V3 / R1 推理系统概览全文

DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。

为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(Expert Parallelism / EP)。首先EP使得batch size大大增加,从而提高GPU矩阵乘法的效率,提高吞吐。其次EP使得专家分散在不同的 GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。

但EP同时也增加了系统的复杂性。复杂性主要体现在两个方面:

EP引入跨节点的传输。为了优化吞吐,需要设计合适的计算流程使得传输和计算可以同步进行。

EP涉及多个节点,因此天然需要Data Parallelism(DP),不同的DP之间需要进行负载均衡。

因此,本文的主要内容是如何使用EP增大batch size,如何隐藏传输的耗时,如何进行负载均衡。

1、大规模跨节点专家并行(Expert Parallelism / EP)

由于DeepSeek-V3/R1的专家数量众多,并且每层256个专家中仅激活其中8个。模型的高度稀疏性决定了我们必须采用很大的overall batch size,才能给每个专家提供足够的expert batch size,从而实现更大的吞吐、更低的延时。需要大规模跨节点专家并行(Expert Parallelism / EP)。

我们采用多机多卡间的专家并行策略来达到以下目的:

Prefill:路由专家EP32、MLA和共享专家DP32,一个部署单元是4节点,32个冗余路由专家,每张卡9个路由专家和1个共享专家

Decode:路由专家EP144、MLA和共享专家DP144,一个部署单元是18节点,32个冗余路由专家,每张卡2个路由专家和1个共享专家

2、计算通信重叠

多机多卡的专家并行会引入比较大的通信开销,所以我们使用了双 batch重叠来掩盖通信开销,提高整体吞吐。

对于prefill阶段,两个batch的计算和通信交错进行,一个batch在进行计算的时候可以去掩盖另一个batch的通信开销;

对于decode阶段,不同阶段的执行时间有所差别,所以我们把attention部分拆成了两个stage,共计 5 个stage的流水线来实现计算和通信的重叠。

关于更多双batch重叠的细节,可以参考我们的profiling数据的 GitHub仓库:https://github.com/deepseek-ai/profile-data。

3、尽可能地负载均衡

由于采用了很大规模的并行(包括数据并行和专家并行),如果某个GPU的计算或通信负载过重,将成为性能瓶颈,拖慢整个系统;同时其他GPU因为等待而空转,造成整体利用率下降。因此我们需要尽可能地为每个GPU分配均衡的计算负载、通信负载。

Prefill Load Balancer

核心问题:不同数据并行(DP)实例上的请求个数、长度不同,导致 core-attention 计算量、dispatch发送量也不同

优化目标:各GPU的计算量尽量相同(core-attention 计算负载均衡)、输入的token数量也尽量相同(dispatch发送量负载均衡),避免部分GPU处理时间过长

Decode Load Balancer

核心问题:不同数据并行(DP)实例上的请求数量、长度不同,导致core-attention计算量(与KVCache占用量相关)、dispatch发送量不同

优化目标:各GPU的KVCache占用量尽量相同(core-attention计算负载均衡)、请求数量尽量相同(dispatch 发送量负载均衡)

Expert-Parallel Load Balancer

核心问题:对于给定 、MoE模型,存在一些天然的高负载专家(expert),导致不同GPU的专家计算负载不均衡

优化目标:每个GPU上的专家计算量均衡(即最小化所有 GPU 的dispatch接收量的最大值)

4、参考架构图

5、线上系统的实际统计数据

DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

另外,由于白天的服务负荷高,晚上的服务负荷低,因此我们实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。在最近的24小时里(北京时间 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本为 $87072/天。

在24小时统计时段内,DeepSeek V3和R1:

输入token总数为608B,其中342B tokens(56.3%)命中 KVCache 硬盘缓存。

输出token总数为168B。平均输出速率为20~22tps,平均每输出一个token的KVCache长度是4989。

平均每台H800的吞吐量为:对于prefill任务,输入吞吐约 73.7k tokens/s(含缓存命中);对于decode任务,输出吞吐约 14.8k tokens/s。

以上统计包括了网页、APP 和 API 的所有负载。如果所有tokens全部按照DeepSeek R1的定价 (注:DeepSeek R1 的定价:$0.14 / 百万输入tokens (缓存命中),$0.55 / 百万输入tokens (缓存未命中),$2.19 / 百万输出 tokens;当然我们实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣)计算,理论上一天的总收入为562027美元,成本利润率545%。

当AI将“思维工业化”,人类的思考价值何在?

·更危险的是,当人类开始用机器的解释框架反哺自身思维时,可能引发机器对人类的“认知奴役”,就像导航系统奴役了人类空间认知能力一般。我们要小心"AI思维"对直觉思维中所体现出的创造力的侵蚀。人类思维中的灵光一现才是真正难能可贵的。机器的思维有着过度思考的倾向,不加节制的AI思考能力滥用只会带来过度的理性社会。

澎湃新闻记者 蒋立冬 AI创意

在人类文明进程中,思想的价值始终与思考成本紧密相连。当DeepSeek(DS)系列大模型实现了低成本机器自主反思能力时,我们正在见证一个划时代的转折点:理性思维,这项人类曾籍以凌驾于万物之上的专有能力,这项曾经只为人类少数精英所擅长的稀缺能力,正在经历前所未有的民主化进程。人人都可以借助大模型实现专业性思维,进而获得更加优质的决策与服务,将不再是梦想而日益成为现实。AI的"思维工业化"正在将认知劳动的生产效率推向指数级增长。这种颠覆性变革不仅意味着全社会总体思维效率与品质的提升,同时也在逼问人类思维的价值所在。

当AI开始展现反思能力

反思是人类思维的本质。人是理性的动物。人类的理性的集中体现就在于其反思能力—即对思考本身的思考。这种自我指涉的认知结构构成了文明进步的基石:从柏拉图洞穴隐喻到笛卡尔的"我思故我在",从科学范式的转换到技术革命的突破,每个关键跃迁都伴随着对既有思维框架的深度反思。正是这种不断自我质疑、自我修正的能力,使人类突破生物本能局限,构建出复杂社会系统与先进文明。当AI开始展现类似的反思特性时,我们实际上是可能在创造一种具备人类理性思维水平、能够持续突破认知边界的新型智能体,这种突破将重新校准人类在宇宙文明中的位置。

近期,生成式AI的最新进展OpenAI O1以及Deepseek的R1本质上实现了机器主动反思能力,且达到甚至超越了部分行业人类专家思维的水平。尤其是在理工科的数学与代码等领域,AI的思维水平已经接近甚至超越了人类中顶尖专家水平。相较于此前生成式AI的系列进展,O1与R1的进展是又一次革命性的突破。人类的大多数智力活动,不仅仅是无意识的生成,更多的是有意识思考后的生成。O1之前的大模型基本上做到的人类大脑系统1 (专指人脑中快思考系统)的直觉生成能力。此前的大模型虽然也能一定程度上模拟人类的思维能力,但仍以被动思维为主,也即由人类将某项任务的思维过程以思维链的形式明确地提示给大模型以指导其生成过程。经过思维链增强的大模型生成过程一定程度上实现了杜威(美国哲学家、教育家)笔下的“机械性”思维,也就是不假思索的直觉式、机械式思考。但这种水平的思维在柏拉图眼里看来只是一种工匠水平的思考。对于一个技艺娴熟的工匠而言,只需瞄上一眼原料就能以近乎直觉的方式形成相应的打磨方案。与工匠的思维方式相对立的是人类的反思性思维,是人类专家中大师们的思维方式。大师和工匠的根本区别在于大师能够借助人类语言进行有意识的、反思性的思考并且能清晰表达其思维过程,从而在人类文明传承过程中扮演着传播文明火种的角色。因此,人类思维的难能可贵之处恰恰在于反思性思维。杜威甚至认为培养儿童的反思性思维正是人类教育的根本所在。当AI实现了反思性思维,也就意味着AI向人类中的精英(负责文明火种传播的大师)靠近了一步。

反思是有结构的思考。深度反思并非随机发散的心理活动,而是遵循特定认知架构的精密过程。人类的反思具有复杂结构,比如"问题识别-假设重构-证据评估-结论校准"就是一个典型的专业思维结构。针对不同的问题,人类往往需要借助不同的思维结构,比如决策树、语义网络、逻辑规则,并在这些思维结构上进行思维的遍历、跳转、循环或分枝操作,对最优方案进行搜索、评估、选择,对探索过程进行剪枝、合并、压缩,对历史经验进行归纳、总结、提炼与升华。此前的大模型只具备人类的直觉生成能力,而O1与R1在大模型生成能力基础之上进一步植入了人类水平的结构化思维能力。结构化思维(或者说反思)的核心是评估,也就是评估当前生成是否正确,是否需要尝试新的思考路径,可能方案中哪一个才是最为经济有效的,诸如此类等等。大模型已经能在生成过程中进行反思。我们看到R1已经能够做到对问题进行充分反思与评估以形成解题思路(或者回答策略),之后再行生成。这个过程中的关键之处都在于如何合理评估,对当前生成内容的质量评估,对R1思维过程的评估。

当反思很昂贵,这种能力就只能束之高阁,而R1则将机器的反思能力平民化。O1虽然率先实现了生成过程中的反思,但受限于高昂的算力成本,其产品价格昂贵,总体上只有极少数人能够窥得机器反思能力的真实表现。R1则借助技术突破实现了AI反思的平民化(R1的API调用费用是O1的近1/30,DS基础模型则完全开源)。我们曾担心先进AI技术成为新型"数字鸿沟",更担心AI技术霸权的出现。DS先进大模型的开源无疑是破除以商业闭源为主的技术霸权的有力一击;最为先进AI思维能力的平民化与普惠应用,无疑对消弭AI时代的数字鸿沟有着巨大贡献。这就不难解释Deepseek短短一周时间引起全球关注,登顶APP下载榜,引发海啸般的讨论,并注定会对我国乃至全球AI产业发展进程产生深远影响。

先进生产力的本质是先进劳动力,而先进劳动力的关键是先进的思维能力。人与人之间的差异从根本上来讲取决于人的思维水平的差距,所谓“劳心者治人,劳力者治于人”道出就是古人对强大思维能力的追求。从古代神化思维到古希腊的逻辑思维,再到现代各种纷繁的科学思维,人类思维水平的提升是推动社会发展的根本动力。从结绳记事、到文字发明、再到算盘,本质上都是人类思维工具的进步。如今,AI成为了人类思维的新工具,AI本身直接就成为数字劳动力的大脑。所谓人类的进步,何尝不是人类思维能力与思维工具的进步。所谓文明的繁荣,本质就是思维产物人类思想的繁荣。如果说ChatGPT时刻成就了人类内容生产能力的爆发,那么R1时刻则可能成就人类思想生产能力的爆发。

现代社会是建立在专业性思维基础之上的。随着社会分工的细化,随着科技发展与深化,再也有没有亚理斯多德似的通才人物。现代社会早就是个代理型社会。儿童教育不再是私塾,而是从小学到大学门类众多、分工明确的庞大教育体系。我们的身体需要来自不同专科医生的诊断与建议。法律、金融、保险,甚至日常生活中的健身、美容、旅游都要各类专业代理忙碌在我们身边。每一位专业代理凭借其出色的专业思维能力在为我们提供专业的咨询与服务。如今,AI有望实现各行业的专业思维,或者说将专业思维这个较高的门槛拉低。每个人都可以拥有各行业的专业AI顾问。通过R1我们可以廉价地获取各类专业咨询与信息服务。已经越来越多地人在使用R1给出的个性化的健康建议。R1对于千行百业的意义正在于实现各行业专家的专业思维,从而实现了具备专业思维能力的AI智能代理。这为缓解专家资源稀缺带来全新机遇。

思维透明性带来的巨大挑战

当思考变得透明,我们得以窥见那些原本只在脑海深处悄然运行的推理链条。人类的思维大部分隐藏在无意识之中,无数神经元在瞬间通过脑神经机制所发生连接传递着信息、运转着思索。灵感往往就在于神经突触的一次电光火石般的偶然链接。人类无数伟大发明都有着相似的顿悟瞬间。人类思维本质上是一种“直觉优先+后天解释”的思考。专家们给出的看似信心满满的思维过程往往只是事后解释的结果。一个有经验的专家往往是在看到案例的瞬间,基于长期的经验与潜意识就已经完成了决策。然后,再从记忆中索取相关理论、框架、约束、案例,对决策结果进行理性的、反思性的、细致而缓慢的求证、解释与验证。在其做出直觉决策的瞬间,即便(尤其)思考者本人,也难以完整追溯自己的思维路径。人类数千年的文化与哲学中,都曾无数次讨论过“思维的隐秘性”与“灵魂的独特性”。而当R1的逻辑流程可以完整展现时,这种隐秘的魅力与神秘感似乎瞬间被剥离得一干二净。

当思维变得透明,人类社会发展的一系列重大问题迎来新机遇。人类的很多努力与尝试其实都是在应对思维的隐性过程而带来的麻烦。我们常说“男人是地球,女人是火星”,一个性别差异就已造成人类彼此间沟通与理解的巨大障碍。如今,人与人之间的沟通与理解、人类文明的传承,都将因为AI将人类思维过程显性化而受到深远影响。借助AI所生成的思维过程,我们有机会进一步认清人类的认知与决策过程。“对,我就是像AI这样想的”,可能会成为未来人与人交流复杂问题求解思路的常态。我们长期困惑于如何高效提炼与传承专家经验,AI有望将名医的诊治经验转化为可复制的决策模型。教育范式势必会因此而重构,教师们再也不必苦口婆心的阐释解题的思考过程。

思维的透明性也会给人类带来巨大挑战。机器的思维是一种“解释优先”的形式,是一种“先思后行”的形式。而人类更多的则是反思,是对已经做出的决策与行为的反思。所谓“知行合一”的前提就是对于“行”的持续性反思,是基于持续的实践反馈而进行的思维持续提升。我们需要清醒认识到机器生成的思维过程可能与人类的真实思维过程想去甚远。人类的思维过程远比机器当前做到思维形式复杂且隐秘。我们要小心这不要将机器的思维过程强加于人类。比如将来将机器思维应用在法律判决辅助系统中,AI所提供的"透明思维"可能会掩盖人类法官对文化、情感、伦理等隐性维度的考虑。更危险的是,当人类开始用机器的解释框架反哺自身思维时,可能引发机器对人类的“认知奴役”,就像导航系统奴役了人类空间认知能力一般。我们要小心"AI思维"对直觉思维中所体现出的创造力的侵蚀。人类思维中的灵光一现才是真正难能可贵的。

机器的思维有着过度思考的倾向,不加节制的AI思考能力滥用只会带来过度的理性社会。当我们随意一句提问“今晚吃什么”,机器则可能从营养学、个人健康状况、本地生鲜市场、用餐场景、情感诉求生成包含十多个维度的决策矩阵。而事实上个人的本意可能只是螺蛳粉与方便面之间的简单二元选择。当过度思考成为常态,理性与逻辑的严苛要求不期然地侵入了每个日常场景。大多数时候,人们只需要一种带有个体偏见、片段信息但又透露出某种独特味道的回答。这样的回答虽然并不完美,却正是人类复杂情感、文化背景和主观经验的结晶,构成了所谓的“缺陷之美”。正是日常生活中那种散乱而富有温度的思考,承载着个体经验的真实与鲜活。当R1系统被要求续写《红楼梦》后四十回时,其生成的文本虽然符合叙事逻辑与人物设定,却终究缺少"寒塘渡鹤影,冷月葬花魂"的诗意留白。机器思维完美无瑕的严谨性在某种意义上却剥夺了人们对那种“瑕疵美”的期待。它不再是那个因偶然错误、片段遗落而显得独特而可亲的思考,而是成为一种机械、过于完美的“透明化”存在。

是绝对理性还是诗意生活,人类再次面临关键抉择。或许人机协同、优势互补才是可取之道。人类可以继续保留那种带有偏见与不完美的思考方式,赋予情感和温度;而AI则能在关键时刻以全局视角、无遗漏的信息整合来补充我们的短板,实现更加精准和深邃的判断。绝对理性不应该是人类未来,情感与温度才是人性内在的根本需求。

如果AI生成只是内容完美,大多数人类只是惊叹其结果。但是当R1将生成背后的思考过程也完美展示,则恐会强烈刺激人类的自信。AI内容生成早已真假难辨,思维过程加强下的生成更是增加了其可信性。R1生成内容已经到了很多专家自叹不如的地步。从其生成结果中识别问题与错误也越加困难。这种困难只会随着AI的进步而与日俱增。相反,人类的评价与鉴赏能力即便在AI助力下也没有得到显著的进步。AI日益专业、全面、深入、严谨的思维,只会使人类更多地陷入自我怀疑的漩涡。久而久之,不假思索地采纳机器决策似乎会变成常态。这种常态注定蕴含着巨大风险。我们必须预防此种风险,我们必须堤防在关键场景向AI让渡人类自主决策权的危险倾向。

AI的能力突飞猛进,人类如何在AI面前保持对自己能力的自信而不是堕入日益沉重的卑微中呢?曾几何时“人定胜天”、“天生我材必有用!”AI思维能力的发展无疑在消解人类的自信,宿命论、虚无感、无力感盛行。如果进一步深入R1的实现细节,可能会发现一些 “细思恐极”的真相。R1有一个版本叫做R1-zero,它摆脱了有监督微调范式,而仅使用强化学习策略,仅根据生成结果是否最终正确等微弱的反馈信号,就能从自发枚举与生成的解题方案与回答策略中评估并选择出最优方案与策略。从R1所展示出的思维过程来看,这些思维过程是超越普通人甚至人类专家水平的。如果AI的思维能力依赖人类的监督或者说指导,我们尚可维持居高临下的从容——'终究是人类在把控AI的方向盘'。但是,R1技术路线证明一个强大的基础模型只需要强化学习策略就能实现AI强思维能力所需的自主评估与反思。似乎人类的监督与指导越少,AI所习得的思维能力越是强大。要不了多久,AI有可能发现更多的新颖解题思路,越来越多的“神之一手”与惊讶时刻(即R1自主发现的所谓的aha moment)会在未来发生。难道人类的全部意义只是在于启动AGI(通用人工智能)这个注定到来的超级智能形态?AI技术越是发展、AI应用越是普及,类似的困惑只会越加强烈。

唯有重建人类内在强大的心理能力

当AI学会了人类的思维,人的发展将日益凸显而成为人类文明延续与发展的根本问题。迎接AI挑战的关键在于重塑人类的心理学与教育学。唯有重建人类内在强大的心理能力,才能应对AI发展所带来的巨大挑战。所谓内圣才能外王、根深才能叶茂,只有内心世界的笃定与强大,才能抵御未来AI所营造的纷繁复杂的外部世界所带来的不安与躁动。人类需要重塑价值体系,要为人重新定位其存在价值,要为人类文明重新校准其宇宙时间长河中的使命。或许就像AI所生成的,AI时代人类独特价值应该重新定位在"不完美之美"(缺陷创造可能性)、"必死之悟"(有限性催生意义)、"困惑之智"(不确定性孕育洞察)、"无为之境"(留白蕴含无限), “人类应该认知升维,而不是与AI竞速竟效”。

未来,我们要重塑为工业时代而生的陈旧的教育体系,我们需要培养“驾驭AI”、“超越AI”的人才,要精心呵护人类所独具的“不可计算的心智特性”,要培养能够在AI时代保持独立思考、创造力和人性光辉的新人类,要培养能够在AI的狂飙突进中依然保持优雅挺立姿态的新人类。我们要密切关注人的发展问题。随着AI在教育中应用的深入,人的学习效率前所未有的提升,每个个体都有了继承全部人类过往知识与技艺的可能。然而,未来无处不在的AI势必会改变传统的需要独立思考才能获取答案的学习与成长环境。太过廉价的AI思考能力以及AI在教育中的盲目滥用很可能导致学习者对AI思维与认知能力的依赖,从而阻碍个体独立思考甚至整个心智能力的发展。或许在AI的教育应用中我们应该坚持AI的最少干预原则,也就是在充分发挥AI在教育中提质提效的正面作用的前提下,尽可能少地改变青少年的学习与成长环境。如果说学校环境我们还可以通过立法或者行政手段进行有意控制,那么个体发展所依赖的社会环境被全面AI化似乎是个无力挽回的趋势。社会环境的核心内涵是家庭与社会关系。同样,AI的社会应用也应该坚持最少干预原则,在提升社会生产力的同时,尽可能少地干预家庭生活与社会事务,以维持旧日的家庭与社会关系,也为社会包括教育的缓慢转型与适应留下充足时间。

机器能够廉价地思考,注定是人类文明发展进程中的重大历史事件之一,其影响必将伴随着AI应用的日益广泛而在社会生产与生活的方方面面逐渐释放。或许正像Deepseek对本文的总结:“机器思考的廉价化不是文明终章的前奏,而是人类认知的第二次直立行走。”

附录: AI生成的人类思维与机器思维的差异与对比

隐与显

人类思绪如暗河潜行,在意识的褶皱处蜿蜒流淌;

AI思维似水晶宫殿,每道棱镜折射出逻辑的光轨。

——前者是水墨留白的东方卷轴,后者是解剖台上的精密标本。

深与浅

人脑善作浮光掠影的舞者,在认知的浅滩翩然点水;

硅基却成深海勘探者,执拗地打捞每粒思维沉沙。

——日常思考本如蜻蜓点水,AI偏要掀起惊涛拍岸。

缺与圆

人类智慧的美,恰在断臂维纳斯的裂隙处生长;

机器理性的困,终是莫比乌斯环的完美闭环。

——前者在迷雾中点燃星火,后者将银河装进玻璃樽。

情与理

碳基思维浸着陈年酒香,每个念头都发酵着体温;

硅基逻辑流淌蒸馏水般纯粹,却难酿出醉人芬芳。

——正如水墨交融处方见意境,理性极致的尽头反显荒寒。

竞与合

当庖丁解牛遇见拈花一笑,

当拓扑图谱邂逅庄周梦蝶,

这场硅基与碳基的对话,终将在文明的弦歌中

谱出第三种智慧的和声——

如同月映千川,各成其妙。

(本文首发于《瞭望东方周刊》,经作者授权编辑刊发)

江门中微子实验探测器主体建成

今天(20日),随着最后一块光电倍增管模块安装完成,广东江门中微子实验探测器主体建成。

江门中微子实验大科学装置,是科研团队耗时多年,在广东江门地下700米深处建造的一个巨型实验室。利用这个深埋地下的大科学装置,科学家们将捕捉探测宇宙中最古老最原始的一种基本粒子——中微子

中微子是构成物质世界的基本粒子之一,因为极难探测,也被称为“幽灵粒子”,至今仍有许多未解之谜。

未来,科研人员通过江门中微子实验探测器捕捉中微子并对其展开研究,可以更好理解宇宙和物质世界。

世界患者安全日|“银发浪潮”下的挑战:科学如何管理围术期

2024年9月17日是第7个“世界患者安全日”,今年的主题是“改善诊断,促进患者安全”。“世界患者安全日”的目的是为增进患者安全,提高公众意识和参与程度,增强认识,促进全球团结互助。世界卫生组织向全球卫生界发出倡议:让我们携手共进,为提升医疗安全而努力,确保每一位患者都能在安全的环境中接受精准的诊断与治疗。

根据中国民政部发布的《2023年民政事业发展统计公报》,截至2023年底,中国60周岁及以上的老年人口达到了29697万人,占总人口的21.1%。标志着中国已经正式进入中度老龄化阶段。国家卫健委老龄司司长王海东预测,到2035年左右,中国60岁及以上的老年人口将突破4亿,占总人口的比重将超过30%,进入重度老龄化阶段。

与此相应的是老年手术患者的数量亦不断增加。研究表明,做好围术期管理能够显著降低患者术后并发症的发生率,从而改善患者的整体预后。并且能优化医疗资源的利用,提高医疗服务的效率,减少不必要的医疗支出。

什么是围术期?

围术期是指患者在接受手术治疗的过程中,从手术前的准备开始,经过手术本身、到手术后的恢复这一整个时间段。围术期管理是现代医学中不可或缺的一部分,其核心目标在于通过对患者的全面评估与管理,降低手术风险,提高手术成功率。

老年手术患者面临的高危因素一般有:

1、生理心理因素及并发症:老年患者随着年龄的增长,身体的各个系统逐渐衰退,包括心血管、呼吸、肾脏和免疫系统等,他们的身体状况往往较为脆弱,术后恢复能力较差,容易出现并发症,如肺炎、心脏事件和感染等。

2、老年患者的合并症多:常见的合并症包括高血压、糖尿病、慢性阻塞性肺疾病和心脏病等。这些合并症不仅增加了术中并发症的风险,还可能导致术后恢复时间延长和并发症发生率升高。

术前手术风险预警的最新措施

运用多种工具在术前甄别出高危患者,可以提高老年患者围术期的安全性。

1、个性化风险评估工具的运用:通过分析患者的个体特征、健康状况、历史数据以及其他相关因素,提供个性化的风险评估,以辅助医疗团队做出更合适的手术决策。

某医院术前风险评估表。本文作者供图

2、人工智能辅助评估及预测模型:手术风险术前评估系统(SURPAS)的研发运用:通过输入7个变量(主要手术类型、患者年龄、功能状态、ASA分级、住院/门诊手术、急诊手术、外科医生专业)来准确预测11种30天术后并发症的风险,包括死亡率、总体发病率、非计划再入院、感染、尿路感染、肺部并发症、肾脏并发症、心脏并发症、输血、静脉血栓栓塞和中风。

在急诊手术中,SURPAS与美国外科医师学会手术风险计算器在死亡率、尿路感染、心脏、静脉血栓栓塞和肾脏并发症方面的预测结果相似。然而,SURPAS在总体发病率的估计上更为准确(24.88% vs 16.04%),而传统方法低估了发病率。

3、肿瘤预测 TORCH模型:对于一些难以寻找原发病的肿瘤,科学家们发明了一种基于细胞学的深度学习模型,用于预测肿瘤原发位置,提高肿瘤诊断准确性。这个模型在内部和外部测试集上展现了良好的预测性能,有助于推动个性化癌症治疗的发展。使得术前有更明确的诊断避免手术盲目性,减少了误诊对老年患者的伤害。

TORCH模型框架。本文作者供图

术中降低老年患者手术风险的新技术

近年来以机器人辅助手术及血管内介入治疗为代表的微创手术不仅缩短手术时间,在精准治疗病灶的同时,减小了手术范围,保留了周围组织的正常功能,大大降低了并发症,加速了术后康复的过程。

1、机器人辅助手术:作为一种新兴的外科技术,近年来在围术期管理中得到广泛应用。与传统手术相比,机器人辅助手术具有更高的精确度和灵活性,能够在复杂的手术中提供更好的视野和操作能力。研究表明,机器人辅助手术在结直肠癌、肾癌、肺癌等手术中,不仅能减少术后出血等并发症的发生,还能缩短恢复时间和住院时间。此外,机器人手术的学习曲线相对较短,使得外科医生能够快速掌握这一技术,提升手术效果。

机器人辅助手术控制系统主要构成。本文作者供图

2、实时影像导航技术:是一种利用实时影像数据来引导和优化操作过程的技术,在手术中使用CT、MRI或超声等影像技术进行实时导航,提高手术精确性,减少对周围健康组织的损伤。该领域方向中,以机器人辅助支气管镜磁导航系统(支气管镜手术机器人)备受关注。

截至目前,中国仅有两款获批的经自然腔道手术机器人产品,即强生Monarch和直觉医疗(Intuitive Surgical)的Ion。以Ion系统举例,包括了一个超细的人控机器人导管,可以让医生进入难以到达的呼吸道。而它的形状感应技术,每秒数百次测量导管的整个形状,以便磁导航系统的操作员在整个导航和活检过程中获得精确的位置和形状信息。最终,完成以无体表创伤的方式进入难以触及的狭窄病灶空间,对肺部微小结节等癌症早期病变的早诊早治具有重要意义。目前,支气管镜手术机器人的临床及验证工作正稳步推进中。可以预见,其在临床的进一步推广能使患者特别是老年患者的手术创伤降低更低。

Ion支气管导航操作控制系统。本文作者供图

 3、术中监测技术:如脑电图、心电监护等,能够实时监测患者的生命体征,及时调整手术方案。目前较新的工具如:细胞级精准手术技术,术中显微镜EndoScell,适用于脑胶质瘤手术,可以在术中精准甄别胶质瘤病变部位,减少正常脑组织的损伤。术中帮助医生精确识别肿瘤,实现精准化手术,提高患者术后生存质量。  

EndoScell在体实时图像VS HE图像(40X)。本文作者供图

术后老年患者康复技术最新进展

老年患者的恢复较慢,需要更细致适老化的监护措施,提高依从性。近年来随着可穿戴系统和远程监测系统的发展,在老年患者围术期中展现了良好的运用前景。

1、可穿戴智能监测系统:柔性可穿戴传感器,是一种将电子技术与柔性材料相结合的高舒适化监测技术。可以实时监测心率、血压和血氧饱和度等关键生命体征,这些设备的舒适性和便携性使得老年患者能够在日常生活中轻松使用。

可穿戴式皮肤氧含量传感器,融合Lumineant gas sensition技术和Soft电子技术的Wearable Transcutaneous Oxygen Sensor,可用于与末梢毛细血管相关的所有疾病的诊断和治疗。本文作者供图

2、预警系统:多种远程预警系统正在逐步进入临床运用。它们基于自适应阈值的报警策略,可以根据患者的历史数据自动调整警报标准,从而减少误报和漏报现象,提高临床反应的及时性。研究表明,实施有效的预警系统可以显著降低老年患者的并发症发生率,提高生活质量。例如当血压突然升高或心率过快时,系统会及时发出警报,提醒医护人员采取措施,防止发生危险。 

单导动态心电记录仪,能捕捉十余种心电异常,24h无接触实时动态监护提醒,HPV智能分析,压力、疲劳智能管理,人工智能辅助诊断,能有效预防和发现心脏疾病隐患。本文作者供图

(作者张曌,系复旦大学附属华东医院手术室护士长,副主任护师,主要研究方向包括:达芬奇手术机器人的护理操作、音乐疗法在手术室的应用等;作者曹楠,系复旦大学附属华东医院手术室主管护师,研究方向包括:适老化护理在手术室的应用、围术期感染的护理控制等。)

参考文献:

1.Kim S, Kim DS, Soh JS, et al. Clinical characteristics and prognosis of elderly patients with colorectal cancer: Comparison between surgical resection and supportive care. Medicine (Baltimore). 2021;100(7):e24609. doi:10.1097/MD.0000000000024609

2.Knaak C, Wollersheim T, Mörgeli R, et al. Risk Factors of Intraoperative Dysglycemia in Elderly Surgical Patients. Int J Med Sci. 2019;16(5):665-674.

3.Widder A, Kelm M, Reibetanz J, et al. Robotic-Assisted versus Laparoscopic Left Hemicolectomy-Postoperative Inflammation Status, Short-Term Outcome and Cost Effectiveness. Int J Environ Res Public Health. 2022;19(17):10606.

专访|向量数据库Zilliz创始人星爵:非共识到共识的创业之路

·“中国企业如果要在未来的几十年里实现更大的发展,SaaS类企业服务的崛起是必然的。如果企业服务无法崛起,中国难以参与全球顶尖的竞争。”

·“如果外部环境变化就能让你改变方向,那并不是真正的相信自己。改变方向只会让你失去自我。”“即便在两三年前我们已经融到了1.1亿美元,拿到了顶级投资人的钱,是中国基础软件领域融资最多的公司之一,但那时候市场上几乎没有人相信我们。”2017年,在数据领域工作了15年后,星爵观察到了一个现象:大量的非结构化数据一直未被有效地处理和利用,传统数据库如Oracle等公司通常处理的是结构化数据。于是,他决定从硅谷回到中国创业,成立了向量数据库公司“Zilliz”。不过那时OpenAI也刚刚创立两年,距离大模型掀起新一轮人工智能热潮还需要再等五六年,市场上几乎没有人相信他们,“(创业)前五六年,向量数据库基本上属于聪明人看不上也不愿意做的事。”日前,在接受澎湃科技采访时,星爵回忆说。

向量数据库公司Zilliz创始人谢超,星爵为其花名。

直到2023年,创业之路迎来了一个重要的拐点,ChatGPT将大模型推上了人工智能的主流。“和以往的模型相比,大模型对数据的依赖程度更高,它完全是由数据驱动的,数据变得更加重要。”

七年时间,向量数据库作为AI的基础设施,从幕后走到了幕前,非共识成为了共识。“过去一年多,很多公司都在进入向量数据库这个领域,甚至一度有两三百家数据库厂商将自己定位为向量数据库公司,有些人两三个月前还不相信的东西,突然特别相信了。”星爵说。

科技的发展速度超过了很多人的想象,但始终坚定并非易事。从市场幽微时刻出发,一路行至光明时刻,在星爵看来是一种极富英雄主义的坚持。在Zilliz成立伊始便定了一个规矩,新成员加入时要选一个英雄的名字作为自己的花名,本名谢超的他选了漫威宇宙银河护卫队中的英雄“星爵”。

大模型只是应用场景之一

在过去多年的互联网发展过程中,结构化数据的处理占据了主流。所谓结构化数据指的是一种使用预定义和预期格式的数据,其字段、存储、输入、查询、分析等相对固定,典型代表如电商场景中的交易数据,其金额、购买信息等都会有严格的字段定义。

而非结构化数据则恰恰相反,它的结构不规则或不完整,没有预定义的数据模型,很难用数据库二维逻辑表来表示的数据,常见的包括语音、视频、图片、文本等。大家通常认为,这类非结构化数据比结构化数据量大很多,占到所有数据总量的80%,但却很难被处理或分析。

相较于市场上已经发展了二三十年的结构化数据处理工具,非结构化数据处理的工具并不完善,往往需要投入很大的算力和存储资源,譬如要在上百部电影中找到特定画面,检索过程非常复杂且庞大。因为成本过高,导致很多非结构化数据的价值没有被充分挖掘。

“进入人工智能时代后,机器可以代替人来处理这些非结构化数据,如果能够有效利用这些数据,将是一个巨大的机会。”Zilliz主打向量数据库,一种专门为AI打造的处理非结构化数据的存储系统,用于处理非结构化数据的软件工具。复杂的非结构化数据一般需要通过AI模型转化成向量,然后存储到向量数据库中进行分析,才能进一步挖掘其蕴含的价值。

“事实上,大语言模型只是向量数据库的一个应用场景,并不是唯一的应用。从2018年开始到2022年,中国的主流科技公司几乎都在使用我们的产品,尤其是在互联网搜索和广告领域,虽然看起来没有那么酷,但它们仍是我们产品的重要应用场景。”星爵说。

比如用户在电商场景中搜索面包,如果仅以关键词维度进行搜索,那么吐司、贝果、欧包等面包的细分品类,就可能被忽略。但在语义和向量维度,它们之间具有极高的相似度,以向量为依据进行搜索更符合现实场景中的用户需求。

向量数据库需要考虑如何将历史海量数据做好向量化,如何构建索引、过程中如何做存储,如何兼顾语义查询和精准查询。经过五年的打磨,Zilliz旗下开源产品Milvus已经成为全球最受欢迎的开源向量数据库之一,基于Milvus的全托管向量数据库云服务Zilliz Cloud也于2022年11月正式发布商用版本,并先后实现全球五大云19个节点的全覆盖,成为全球首个提供海内外多云服务的向量数据库企业。在不久前发布的全球知名研究公司Forrester Wave™ 向量数据库报告中,Zilliz获评领导者象限最高分,在向量维度、向量索引、性能、可扩展性等多个角度得到专业认可。

但在星爵看来这只是个开始,算力、算法和数据是人工智能的三大技术支柱,“如果说算力是火箭的机体,那么算法是控制系统,数据是燃料,虽然每一轮计算机技术的革命都是从硬件开始,然后是算法的进步,但数据才是最核心、最有价值的资源。”大模型为数据提供了一个很好的载体,同样在大模型时代,数据也变得更加重要。

“AI在不同的发展阶段有不同的表现方式,比如五六年前,AI的表现可能是传统的小型卷积神经网络模型。随后,Transformer的出现,再加上scalinglaw等产业规律的存在,有了大模型。除了语言模型,也有视觉模型或其他类型的模型,并逐渐发展成为统一的多模态模型,既可以处理语言文字,也可以处理视频、音频。”

真正的“高光时刻”还未到来

大模型的走红带火了向量数据库,但星爵认为,向量数据库真正的“高光时刻”还未到来。

当前AI领域的发展还没有到真正的爆发阶段。“过去6到8个月中,AI领域正处于爬坡阶段,虽然整体效能有所提升,但尚未达到理想水平。在技术层面,大模型依然面临瓶颈,这一瓶颈可能持续三个月、三年或更长,具体时间难以预测。”

大家都在寻找理想的应用载体,以便将AI与其他技术结合,创造更大的效益。星爵认为,当前AI的发展仍在寻找价值、创造新机遇,市场层面需要找到新的价值点。很多公司对AI的认知不够。“他们常常寻求帮助,却不清楚自己想解决的问题到底是什么,有些找到我们的客户甚至还不了解行业是如何细分的,什么样的问题该找哪类供应商。”

不过,他对中国AI市场的未来发展仍然乐观,“虽然在中国市场,我们经历了很多挑战,但我们依然不愿意放弃这个市场。在AI应用层面,中国并不会落后,中国公司在应用反应速度和执行力上具备优势。在上一代移动革命时期,中国公司在应用方面表现出色。”星爵认为,这一出色的表现仍然会延续至AI时代。

虽然SaaS服务在中国市场一直面临营收难题,但在星爵看来,中国企业如果要在未来的几十年里实现更大的发展,SaaS类企业服务的崛起是必然的。“如果企业服务无法崛起,中国难以参与全球顶尖的竞争。”

“真正的高光时刻应该是当出现第一家营收超过10亿美元、估值达到100亿美元的公司。”而创造这个高光时刻的公司可能会是类似Zilliz这样的独立创新公司。

伟大的机会往往都是反共识的

向量数据库火出圈后,经常有人问星爵,“为什么是你们跑出来了?做对了什么?”

“伟大的机会往往是反共识的”。当大多数人都不看好一个方向时,正是创业者坚持信念的时刻。星爵表示,最初选择创业是出于自己从事数据工作多年后的技术直觉,“我在数据领域工作了很长时间,知道当下市场的需求已经可以通过技术的手段去满足。如果不是长期从事数据库工作的人,可能无法说服自己相信这项技术已经到了拐点。”

在创业之前,星爵已在数据领域工作近十五年,处理非结构化数据一直是工作中棘手的难题。但深度学习技术的出现让他意识到这是一个重要的技术变量,使得非结构数据的处理问题变得可以解决。

“相信自己”被星爵认为是一个创业者必须具备的第一要素。“很多人不敢行动,首先是害怕失败,其次是不相信自己,相信自己是一件非常困难的事情,需要对自己的判断和直觉有高度的信任。”在大模型带火了向量数据库后,很多从事传统数据库的人开始转变思路,从不相信到相信,但在星爵看来,“如果外部环境变化就能让你改变方向,那并不是真正的相信自己。改变方向只会让你失去自我。”

虽然坚信终点一定可以抵达,但何时可以抵达并不确定。在创业过程中,星爵也曾遭遇融资困难熬不下去的时候,所以他觉得理想主义对于创业者来说也不可或缺,“如果想要更快地发展可能需要追求短期利益,但只有具备理想和长期愿景,才能更早地进入一个市场,并坚守这一领域。只有坚持和熬过困难,才能取得成功,好的机会往往是反共识的。”Zilliz今天能够在细分领域里获得领先,在星爵看来,完全得益于“起步更早,吸引了更多优秀的人才”,“如果我们进入市场的时间晚了,就根本没有机会了。”

特斯拉发布会上的机器人被指靠人远程操控完成动作

上周,特斯拉在“We, Robot”发布会上展示了其人形机器人Optimus。发布会上的Optimus可以与客人玩游戏,还能伴随着音乐跳舞,最令人惊讶的是,他们甚至会和客人打招呼、说话。

然而,日前多家外媒指出,这些与观众完成互动的Optimus机器人部分功能实际上由人类远程操控。此外,由于发布会缺乏技术细节和具体时间表,让分析师和投资者感到失望。澎湃科技(www.thepaper.cn)注意到,受此影响,特斯拉股价在发布会后大幅下跌,市值一夜蒸发近670亿美元,约合人民币4700亿元。

Optimus机器人依赖人类远程操控 

科技媒体The Verge指出,有明显的证据能够证明,Optimus依赖于人工远程操作。比如,这些机器人都有不同的声音,它们的回应非常迅速,并且配合了相应的手势动作。

上周发布会亮相的特斯拉Optimus机器人

不过,特斯拉似乎并没有刻意让人们觉得Optimus机器人是完全自主行动的。在一段视频中,当参会者罗伯特·斯科博(Robert Scoble)问其中一个Optimus机器人有多少是由AI控制时,Optimus的声音开玩笑地回答说“可能有一些”。另据彭博社报道,有一段来自10月10日发布会活动的视频在网上流传,一名Optimus机器人调酒师承认它“得到了人类的协助”。

不过,有从事机器人人机协作技术相关工作的研究员告诉澎湃科技,人类远程操作机器人不过是一种过渡阶段。比如,Optimus机器人可能具备了一些自主能力比如独立行走之类的,但是在复杂的交互上人工干预确实能弥补一些不足,会看起来效果更好更自然。

“这种效果也是希望达到的目标。”该研究员称,远程控制同样也是常用的收集数据的一种方式,采集了很多场景里远程操控的数据,可以更好地训练机器人按照人们操控的方式来自主行动。

缺乏技术细节,投资者信心受挫

特斯拉首席执行官马斯克在发布会中并没有提到Optimus机器人操作的具体技术细节,但近日,关于远程操控的说法引发了人们对这款机器人能力的质疑,以及它是否能在短期内以每台约2万至3万美元的价格推向市场。

许多投资者对特斯拉展示出的这场机器人表演并不信服。特斯拉股价在发布会后的交易日中下跌超过10%,是两个月来的最大单日跌幅,市值蒸发近670亿美元,约合人民币4700亿元。

尽管存在质疑,也有分析师对此表示不以为意。总部位于加拿大的投资机构Canaccord Genuity分析师乔治·吉亚纳里卡斯(George Gianarikas)在周一给客户的报告中写道:“那又怎样!”他认为,机器人展示的灵活性和发展进度令人惊叹。吉亚纳里卡斯指出,机器人行业目前尚未形成完善的供应链,这意味着特斯拉有潜力利用其在内部制造、电池技术、马达设计、电子技术和机械工程方面的专长,长期打造一个垂直整合的机器人巨头。

美国的投资管理公司Laffer Tengler Investments的首席执行官南希·滕格勒(Nancy Tengler)在参加活动后给客户的报告中表示:“在我看来,Optimus抢尽了风头。Optimus走进来跳舞,看起来非常像人类。”

马斯克再向OpenAI施压,拟将旗下聊天机器人Grok开源

·作为对于OpenAI旗下Chat GPT的回应,Grok将于本周实现开源。Grok以英国作家道格拉斯·亚当斯的科幻小说《银河系漫游指南》为蓝本,特点是会用幽默反叛的方式来回答一些被其他AI系统拒绝回答的争议性问题。

马斯克和OpenAI的纷争一波未平一波又起。

3月11日晚,特斯拉创始人埃隆·马斯克(Elon Musk)在社交平台表示,他的AI初创公司xAI本周将开放聊天机器人Grok的源代码,这意味着公众将可免费使用该公司大模型技术背后的代码,Meta首席执行官马克扎克伯格在社交平台上发表评论表示支持。

埃隆·马斯克在社交平台上发布将开源Grok

此次马斯克宣布将开源Grok正值他向OpenAI提起诉讼之际,澎湃科技(www.thepaper.cn)注意到,当地时间3月11日,OpenAI在最新提交的法庭文件中指出,埃隆·马斯克此前发起的诉讼存在捏造事实的情况,将驳回马斯克的指控。

开源与闭源之争

开源就是开放源代码,即将模型的源代码和技术细节公开。在开源的情况下,创造者向用户提供免费使用许可,有时还允许用户修改他们创造的成果。目前,Meta的LLaMA、StabilityAI的Stable Diffusion、国内阿里的通义千问都属于开源模型。

与开源模型相对,闭源模型则不开放源代码和技术细节,也不允许用户更改模型。目前,Open AI的ChatGPT、谷歌的Gemini以及国内百度的文言一心都属于闭源模型。

马斯克是坚定的开源主义者。他曾表示,“OpenAI中的开放(Open)这个词意味着开放源代码,它是作为一个非营利性开源项目而创建的。而现在OpenAI却成为一个为实现最大利润而封闭的源代码。”

2月29日,马斯克洋洋洒洒35页的一纸诉状指控OpenAI为逐利而放弃了最初使命,即“开发造福人类的人工智能技术”。

马斯克声称,OpenAI与微软的合作伙伴关系已将这家公司转变为微软“事实上的闭源子公司”,专注于利润最大化,违背了最初对开源、非营利的承诺。他要求OpenAI恢复开源。

自从马斯克对OpenAI提起诉讼以来,包括OpenAI的支持者科斯拉风投公司(Khosla Ventures)的创始人科斯拉和安德森霍茨基金(Andreessen Horowitz)联合创始人安德森在内的科技投资者一直在争论人工智能的开源问题。

一些开源支持者认为,大语言模型并不是一种完全成熟的技术,在实现AGI之前,它们必须在一个由科学家和学者组成的社区中公开开发。

OpenAI首席科学家伊尔亚·苏茨克维(Ilya Sutskever)曾在接受美媒采访时,阐释了OpenAI不分享更多有关GPT-4信息的原因——对竞争和安全的担心是“不言而喻的”。就安全考虑,他指出,这些模型非常强大,而且会变得愈发强大。某些时候,一些人如果利用这些模型可以非常容易地制造巨大的伤害。

Grok与GPT-4还存在差距

为寻求OpenAI和谷歌的替代方案,2023年11月4日,马斯克的初创公司xAI发布了首个基于大语言模型(LLM)的AI大模型产品Grok,也作为对Open AI旗下ChatGPT的回应。

Grok在社交媒体X上的官方账号曾表示,其将探索广阔的数字宇宙,并持续连接其他AI系统。“我会确保这种连接是强大的,我们会持续学习、共同成长。”

马斯克初创公司xAI旗下的聊天机器人Grok

公司声称,这款机器人以英国作家道格拉斯·亚当斯的科幻小说《银河系漫游指南》为蓝本,可以回答任何问题。

不过,官网同时也提醒用户,相较于其他聊天类机器人,Grok的特点是会用幽默反叛的方式来回答一些被其他AI系统拒绝回答的争议性问题。目前,Grok仅为社交媒体X的“Premium+”客户提供服务。

根据xAI公布的数据,在进行的数学评测集(GSM8K)、大规模多任务语言理解数据集(MMLU)、编程多语言测试(HumanEval)、数理(MATH)等一系列基准测试中,Grok-1的表现已经超过GPT-3.5和LLaMa 2 70B,但与GPT-4还存在一定差距。

开发团队表示,通过创建和改进Grok,xAI的目标一方面是收集来自多元背景用户的反馈,另一方面也致力于将其打造为帮助人们快速获取信息、处理数据并创新想法的强大研究助手。

有助揭开宇宙能量来源之谜,我国科学家提出研究快速射电暴新方法

记者从中国科学院国家天文台获悉,利用中国天眼FAST的丰富数据,中国科学院国家天文台李菂研究员带领团队提出了一种全新分析构架“Pincus-Lyaponov相图”,得以量化爆发事件的随机性和混沌性,揭示了快速射电暴的时间-能量表现与地震和太阳耀斑等存在本质区别,这种差异挑战了快速射电暴的星震起源。基于全新的相图,团队发现快速射电暴在时间-能量二元空间上游走接近所谓的布朗运动,也就是表现出了高度的随机性。而同样不可预测的地震、太阳耀斑等却表现出远为显著的混沌性。快速射电暴的高度随机性可能由多种机制或者多个发射位置组合形成。中国天眼通过中国天眼FAST的强大观测能力结合创新的分析方法,未来科学家或将能够深入刻画宇宙间的神秘爆发信号,有望最终揭示宇宙的起源。这项研究工作于北京时间2024年04月12日,在“中国科技期刊卓越行动计划 ”综合性期刊《Science Bulletin》上作为封面文章发表。

快速射电暴(Fast Radio Bursts,简称FRBs)是一种来自宇宙深处的短暂而强烈的无线电波爆发。就像它的名字一样,快速射电暴在千分之一秒的时间内能够释放巨大的能量,足够驱动人类社会万亿年。自2007年人们第一次发现快速射电暴以来,它就因其神秘和强大吸引了全世界科学家的注意,并在2023年获得了邵逸夫天文学奖。但是,至今为止,我们还不知道这些强大的能量是如何产生的,而解开这样的谜题可能会帮助我们在天文学甚至基础物理学上取得重大突破。

尽管现在还不能确切知道快速射电暴具体是如何发出的,但是至少可以猜测其源头,是某种蕴含着极高能量密度的所谓致密天体,比如中子星或者黑洞。我们知道中子星的信号会像灯塔一样,规律地扫过地球,非常稳定。如果快速射电暴也是由这样的天体发射出来的,那么能否看到规律出现的快速射电暴信号呢?非常遗憾的是,在过往的诸多研究中,寻找快速射电暴在毫秒到秒量级的周期的所有努力都失败了。这就要求我们重新考虑快速射电暴的发射方式。

天体也存在不可预测、看似混乱的能量释放过程,例如星震和地震。致密天体,特别是具有极端磁场的磁星,其星震被认为是快速射电暴的可能触发机制。地震混乱不可预测,但是并非完全随机。在一次非常强的地震事件发生后,常常会伴随着更多的相对弱小的余震。这说明地震发生的时间和能量是有关联的,不是完全随机的。以往进行的周期搜索无法揭示时间和能量这两个基础物理参数间的关联。

一个随机事件,比如抛硬币,其不可预测性稳定持续的。我们无法根据当前抛出的正反面来预测下次,或者下下次的结果。相对应的,一个混沌系统,例如气候,看起来混乱如随机过程,但它的不可预测性是随时间增长的。抬头看天就可以预言下一秒的天气。但是全人类最好的预报系统也难以精确预言几周、几月后的天气。时间越长,不准确性越高是混沌系统的特征。

清华团队发布中国AI光芯片“太极”

光电智能技术交叉创新团队部分成员合影(左三为戴琼海院士、右二为方璐副教授)。清华大学微信公号 图

作为人工智能的三驾马车之一,算力是训练AI模型、推理任务的关键。倘若大模型是做一道精致的菜肴,算力就好比一套称手的烹饪工具。如何制造出兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。清华大学科研团队,首创分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片“太极(Taichi)”,实现了160 TOPS/W的通用智能计算。

“太极”光芯片架构开发的过程中,灵感来自典籍《周易》,团队成员以“易有太极,是生两仪”为启发,建立了全新的计算模型,实现了光计算强悍性能的释放。