目录
1.人民中科研究院院长李兵 研究员阮晓峰、吴方:
政务系统接入DeepSeek几个问题不容忽视……………………………………1
2.郑州市委政研室韩枫桦:
关于DeepSeek融入机关工作的几点思考………………………………………4
3.中国社科院研究员姜奇平:
谁将取代DeepSeek——对DeepSeek的冷思考…………………………………7
4.商洛市直科技系统干部学习使用DeepSeek交流发言汇编……………………16
5.经济观察报记者周悦:
关于DeepSeek,误读与幻觉……………………………………………………21 6.永州市政务迈入AI时代DeepSeek私有化大模型赋能政务服务………………27 7.杨晓宇:DeepSeek大模型赋能石油化工行业—石化央企引领AI与能
源融合新浪潮…………………………………………………………………28
8.洪观新闻记者万磊:
“DeepSeek+政务”热潮彰显技术赋能强大力量……………………………31
9.侠客岛对话郑永年:DeepSeek带来的震撼与启示……………………………32
10.经济参考报记者王璐:
“牵手”DeepSeek央企“AI+”行动提速…………………………………35
11.光明日报调研组:
DeepSeek“破圈”意味着什么………………………………………………38
12.第一财经日报记者钱童心:
从阿里巴巴到DeepSeek:政府有所不为,企业大有作为……………………47
13.中国经济周刊记者侯隽:
对话董煜:跑出DeepSeek,中国做对了什么…………………………………51
14.中国新闻出版广电报记者朱子钰:
对接DeepSeek,主流媒体破浪前行…………………………………………54
15.中国新闻出版广电报记者朱子钰:
DeepSeek首秀媒体圈:首批尝鲜者讲“拥抱”感受………………………58
16.中国出版传媒商报记者张馨宇:
数字出版人热议DeepSeek……………………………………………………63
17.文艺报记者刘鹏波:
网络作家PKDeepSeek,谁赢了?……………………………………………77
18.文艺报记者刘鹏波:
DeepSeek强势出圈,写诗不再神秘?………………………………………82
19.山东商报记者吴绍博:
DeepSeek诠释遥遥领先………………………………………………………86
20.山西日报记者刘慧芳:
爆火的DeepSeek到底是啥……………………………………………………90
21.成都日报锦观新闻记者胡瑰玮:
DeepSeek“驯化”攻略爆火靠谱吗?………………………………………93
22.经济参考报记者张漫子:
DeepSeek颠覆了什么?——大模型“国产之光”破局的启示……………95
23.南方日报记者刘越亚马芳:
DeepSeek火了大湾区如何作答?…………………………………………100
24.解放日报记者顾泳:
DeepSeek本地化部署与医院系统深度对接………………………………106
25.中华工商时报记者蒋元锐:
DeepSeek将为各行业注入全新活力………………………………………108
26.北京日报记者孙云柯孙颖:
上线DeepSeek助手,人工智能助力城市治理、政务服务更快捷更高效…110
27.中国电子报记者齐旭:
多地“AI公务员”上岗……………………………………………………112
28.上海证券报记者李雁争:
政务系统接入DeepSeek多地数字政府建设进入深化提质阶段…………116
29.北京商报记者金朝力:
多地政府接入DeepSeek智慧政务不止效率………………………………118
30.北京晚报记者孙云柯孙颖:
多区政务平台接入DeepSeek………………………………………………121
31.广西日报记者关海芳罗婧:
广西多家医院接入DeepSeek………………………………………………123
32.惠州日报记者游璇钰:
惠州12345热线引入DeepSeek………………………………………………127
33.济南日记者曹雅欣:
普通人怎样当好AI玩家?…………………………………………………129
34.南方日报记者钟哲吴雅楠吴少敏:
千行百业为何纷纷接入DeepSeek?………………………………………133
35.乌鲁木齐晚报记者王媛媛:
亲测12345热线:DeepSeek赋能,体验高效升级……………………………137
36.南方日报记者刘珊:
全国首创!广州公共资源交易平台全面接入DeepSeek……………………140
37.解放日报记者巩持平:
让DeepSeek替代公务员能给群众倒一杯热茶吗…………………………143
38.南方日报记者唐亚冰:
全省多个地市已部署上线DeepSeek,粤探索AI赋能公共治理……………149
39.北京商报记者魏蔚:
众说纷纭DeepSeek…………………………………………………………151
政务系统接入DeepSeek几个问题不容忽视
人民中科研究院院长李兵研究员阮晓峰、吴方(2025年2月28日)
数字化转型浪潮席卷各行各业,大模型在政务服务领域的应用已成为政府提升服务水平的重要抓手。作为一款开源大模型,DeepSeek凭借其在成本和性能上的优势,在政务服务、公共管理和城市治理等多个领域展现出巨大的应用潜力。然而,在未经过系统论证和整体规划的情况下,简单地接入或碎片化地部署DeepSeek,将面临数据安全、系统适配、成本效益等多重挑战。
一、赋能政务服务现状
据不完全统计,全国已有超过100家政府单位接入DeepSeek,涵盖智能问答、政策分析、交通便民、12345热线等多个场景。这些实践表明,政府正在努力让DeepSeek成为提升服务效能的重要工具,争取为公众带来更便捷、更智能的服务体验。但同时部分地方也出现了“你上我也上”的现象,缺乏对实际需求和应用效果的系统性思考和论证,个别地方甚至出现了夸大宣传。
二、暴露出来的问题
如果未经系统化的规划和设计,简单地部署DeepSeek大模型也面临诸多风
险。
资源浪费与效率失衡风险。目前,部分地方政府在引入DeepSeek时缺乏统一的规划和标准,导致重复建设和资源浪费。例如,一些地方政府在未充分评估实际需求的情况下,投入大量资金引入DeepSeek及算力设备,但由于技术适配性不足或使用场景有限,最终未能实现预期效果,造成投入产出比失衡。此外,当前人工智能技术发展很快,不断出现新的技术和设备迭代,如果没有进行系统和长远的规划,数月之后又要进行系统升级甚至重建。
生成式模型的幻觉所引发的可信度风险。DeepSeek作为生成式AI模型,其输出结果可能存在不可解释性和“幻觉”问题,即生成的内容看似合理但并不符合实际情况。在政策咨询场景中,如果系统提供的答案存在错误或误导性信息,可能引发公众对政府服务的不信任,甚至导致决策失误。
数据安全与模型可靠性带来的系统性风险。DeepSeek的应用依赖于海量数据的训练和调用,这可能带来数据泄露、滥用或被恶意攻击的风险。例如,政务数据中涉及大量敏感信息,如果安全防护不到位,可能导致隐私泄露、数据
篡改等,进而影响政府公信力和社会稳定。
过度依赖技术导致的系统脆弱性与应急能力不足风险。如果政府部门过度依赖DeepSeek等人工智能技术,可能导致系统在面对技术故障、网络攻击或突发事件时显得脆弱。例如,一旦DeepSeek系统出现故障,可能直接影响政务服务的正常运行,甚至引发公众对政府应急能力的质疑。
三、建议对策
对策建议框架示意图
一是准确评估业务应用场景对模型的需求,避免资源浪费与效率失衡。在引入DeepSeek之前,政府部门应充分调研和评估实际业务场景的需求,明确技术的适用性和优先级。例如,对于高频、标准化程度高的业务(如政策咨询、信息查询),可以优先引入DeepSeek以提升效率。而对于复杂、涉及重大决策的业务,则需谨慎评估技术的适用性。同时,建议建立统一的建设标准和评估机制,避免各地重复建设,确保资源投入与产出效益相匹配。
二是准确评估模型和算力成本,平衡投入与收益的关系。在推进DeepSeek大模型与政务服务的深度融合前,系统化论证算力资源、模型开发运维成本与业务收益的平衡关系,是规避技术盲目投入、实现可持续智能化转型的核心前提。例如有的行政审批的智能化应用中,人工智能系统虽将部分环节处理时间
大幅压缩,但因需额外增设人工复核岗位,实际综合成本不降反升。因此,需通过严谨的经济性论证,才能避免因短期政绩驱动导致的资源错配,真正实现“技术投入-治理效能-财政可持续性”的三角平衡。
三是准确评估数据载体的安全边界,筑牢数据安全防线。DeepSeek的应用依赖于海量数据的训练和调用,因此必须明确数据的安全边界,确保敏感信息不被滥用或泄露。具体措施包括,对于非公开数据,要禁止使用API调用的方式,避免数据被截取或泄露。同时,优先采用国产化算力基础设施,确保数据主权和系统安全性。此外,引入加密技术和访问控制机制,防止数据在传输和使用过程中被篡改或窃取。定期开展数据质量与安全审计,及时发现和修复潜在风险。通过这些措施,确保数据在安全边界内高效流动,为DeepSeek的应用提供可靠保障。
四是建立内容安全常态化防控机制,提升技术可信度与公众信任。针对DeepSeek可能存在的生成内容不可解释性和“幻觉”问题,政府部门应建立常态化全生命周期的内容安全防控机制。在模型上线前,要对模型和相关数据进行全面的内容安全评测,达到安全要求方可上线。模型上线后,要对模型运行中的输入内容、推理过程和输出结果进行实时监测和防控。此外,应构建内容安全“红队攻击”机制,不定期对模型进行模拟攻击以发现漏洞,时刻保障智能系统的安全性。
四、结语
DeepSeek大模型在政务领域的应用可以为政府服务带来效率的提升和智能化水平的升级,但同时也面临资源浪费、数据安全、技术可信等多重挑战。需要准确评估业务需求、平衡投入产出、筑牢数据安全边界、建立内容安全防控机制,主动应对这些潜在风险,推动技术与政务服务的深度融合,为公众提供更智能、更可靠的政务服务。
关于DeepSeek融入机关工作的几点思考
郑州市委政研室韩枫桦
目前,DeepSeek人工智能大模型作为一种新兴的技术,正快步“融入”机关工作。前不久,在郑州“新春第一会”上,省委常委、市委书记安伟提出:“聚焦打造智慧政府、责任政府、法治政府,加快引入DeepSeek等大模型,以AI技术全面植入、全面赋能政务服务,有效提升智能化、精准化、无纸化水平。”为有效推进DeepSeek等大模型加快融入机关工作,提升政务数据处理能力,优化行政决策,推动政务流程智能化,促进跨部门协作与信息共享,笔者认为应进一步解决好DeepSeek等大模型融入机关工作可能面临的数据安全和隐私保护等问题。
一、明确目标与定位
一方面DeepSeek等大模型确实能提高工作效率,提升决策质量,增强机关的服务能力和水平。另一方面它只是辅助工具,它不能完全替代人的工作。它能为机关的决策和工作提供数据支撑,确保决策和工作客观、准确。它能推动机关工作的创新,提高工作的质量和水平。
机关在优化行政决策过程中,可以利用DeepSeek等大模型技术进行数据分析和预测,从而更好地制定政策。例如在公共健康领域监测疫情传播趋势并预测潜在风险,以提前采取应对措施。同时,通过自动化工具减少人为干预,提高决策的客观性和准确性;在推动智能化政务流程中,可以实现政务流程的智能化升级。
另外,还可用于优化内部管理流程,如公文处理和资源分配等,提升整体行政效率。它在支持多模态数据处理与分析中,不仅在文本处理方面表现出色,还支持图像、语音等多种数据类型的处理,使其在行政管理中具有广泛的应用潜力,尤其是在促进跨部门协作与信息共享,其开放性和灵活性能够整合不同部门的数据资源,实现跨部门的信息共享和协同工作。
但DeepSeek等大模型在融入机关工作时,可能存在数据安全和隐私保护方
面的隐患,例如可能涉及跨境传输导致信息泄露的风险。
二、数据安全与隐私保护
DeepSeek等大模型融入机关工作时,数据安全与隐私保护至关重要。既要建立严格的数据管理制度,又要加强对数据的加密、备份和访问控制,确保数据安全和保密。同时,要严格遵守相关法律法规,保护公民的个人隐私。
建立严格的数据管理制度。要明确数据的收集、存储、使用和共享规则,
确保数据的合法性、安全性和保密性。要加强对数据访问的权限管理。
建立严格的数据加密技术。采用先进的加密技术对数据进行加密处理,防止数据在传输和存储过程中被窃取或篡改。同时,定期对数据进行备份,防止数据丢失或损坏。
建立严格的数据安全培训。对工作人员进行数据安全和隐私保护的培训,提高他们的安全意识和操作技能,避免因人为疏忽导致的数据泄露。
建立严格的应急响应机制。一旦发生数据安全事件,能够及时采取措施进行处理,降低损失和影响。只有在确保数据安全与隐私保护的前提下,DeepSeek才能更好地融入机关工作,发挥其应有的作用。
三、与现有系统的融合
DeepSeek等大模型融入机关工作,要通过全面评估、合理方案、加强沟通协作以及充分测试验证等措施,实现与现有系统的有机融合。在DeepSeek等大模型融合过程中,要充分考虑系统的兼容性和稳定性,避免出现系统冲突和数据丢失等问题。
进行全面的系统评估。深入了解现有系统的功能、架构和运行情况,找出
其优势和不足之处,为DeepSeek等大模型融入提供依据。
制定合理的融合方案。根据评估结果,结合DeepSeek等大模型的特点和优势,设计出既能充分发挥DeepSeek等大模型作用,又能与现有系统无缝衔接的融合方案。
建立有效的沟通机制。在DeepSeek等大模型融合过程中,涉及多个部门和人员,需要加强沟通与协作,确保各方能够理解和支持融合工作。
进行充分的测试验证。在融合方案实施后,要进行充分的测试和验证,确保DeepSeek等大模型与现有系统的融合达到预期效果。对测试中发现的问题,要及时进行调整和优化,以提高系统的稳定性和可靠性。
四、人员培训与能力提升
DeepSeeK等大模型要在机关发挥应有的作用,需要对机关工作人员进行相关业务培训,使工作人员能够熟练掌握DeepSeeK等大模型的实际操作方法,提高机关人员对DeepSeeK等大模型新技术的认识和应用能力,提升工作效率和质量。一要明确具体培训目标。二要建立完善的考核机制。三要注重能力提升的持续性。
五、持续优化与改进
DeepSeeK等大模型融入机关是一个不断完善和优化的过程。要建立有效的反馈机制,及时收集用户的意见和建议,根据实际需求进行持续优化和改进,确保DeepSeeK等大模型能够更好地满足机关工作的需要。
建立紧密的合作机制。深入了解机关的工作流程和需求,确保DeepSeek等
大模型与之紧密结合。这需要与相关部门进行充分的沟通和调研。
建立有效的反馈机制。鼓励机关工作人员提出对DeepSeek等大模型使用的意见和建议,及时收集并分析这些反馈信息,以便发现问题并进行针对性的改进。
建立完善的维护机制。根据机关工作的实际需求,对DeepSeek等大模型进行技术升级和功能拓展与维护,让机关工作人员充分了解DeepSeek等大模型优势和使用方法。
建立科学的评价机制。定期对DeepSeek等大模型融入机关工作的效果进行评估。
总之,DeepSeeK等大模型融入机关需要在目标定位、数据安全、系统融合、人员培训和持续优化等方面下功夫,以提升政务数据处理能力、优化行政决策过程、促进跨部门协作与信息共享等,提高决策的客观性和准确性,提升整体行政效率,全面提高机关工作效率和服务质量。
谁将取代DeepSeek——对DeepSeek的冷思考
中国社科院研究员姜奇平
一、DeepSeek的一般情况(一)DeepSeek是谁
DeepSeek成立于2023年,公司位于中国杭州,由前对冲基金幻方(High-FlyerQuant)的领导者梁文峰创立。DeepSeek的主要特点是基于开源模型和提供低推理成本的技术。
DeepSeek聚集了一支年轻、技术技能出色的团队,其核心目标是推动通用人工智能(AGI),并以透明和开源的方式进行研究,同时强调通过低成本的技术使先进的人工智能(AI)更容易获取。
(二)DeepSeek的成就
DeepSeek在模型开发上采用了混合专家架构(MoE)等先进算法,这有助于节省显存资源,并提高底层算力的使用效率。这种技术思路在DeepSeek-V2中已经得到验证。
公司通过开源其模型和相关技术,允许更多的AI团队基于这些最先进且成本最低的技术开发新的应用。
DeepSeek-R1是公司推出的一款模型,在短时间内登顶苹果美国区应用商店
免费App下载排行榜,并在中国区也取得了领先的位置。
该模型在多个领域(如文本创作、代码生成等)达到了与OpenAI相当的水
平,但成本仅为OpenAI模型费用的一小部分。
DeepSeek的突出功能之一是其令人难以置信的非常低的API调用价格,使高级AI更容易访问。例如,DeepSeek-R1的起价每百万输入Token为0.55美元、每百万输出Token为2.19美元,这一价格远低于OpenAI或其他美国AI实验室的产品。
(三)DeepSeek引起的市场轰动DeepSeek的成功可能会促使
OpenAI和其他美国供应商降价以保持现有的领先地位。如果更高效的模型能够以少得多的支出参与竞争,那么人们就会质疑Meta和微软等公司的巨额支出,他们分别承诺在2025年将至少650亿美元主要投入在AI基础设施上这一资本支出。
DeepSeek在全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌,而科大讯飞等与DeepSeek相关的中国股票则出现上涨。
1月27日,纳斯达克100指数期货跌幅扩大至5%,标普500指数期货下跌3%。欧洲方面,科技股领跌,芯片设备制造商阿斯麦控股下跌11%,Cboe波动率指数(VIX)走高。如果此番跌势维持,纳斯达克100和欧洲斯托克600科技股指数所蒸发的市值总额将达大约1.2万亿美元。
“DeepSeek的成功显示出开发成本较低的强大AI模型是可能的,”瑞士联合私立银行(UnionBancairePrivee)董事总经理Vey-SernLing表示,“这可能会冲击目前由少数科技巨头高额支出来驱动整个AI供应链的投资逻辑。”
(四)DeepSeek的创新
DeepSeek-V3和DeepSeek-R1都利用了混合专家架构(MoE),该架构仅激活其6710亿个参数中的一个子集。可以把它想象成部署数百名专业的微观专家,在需要他们的技能时介入。这种设计确保了计算效率,同时保持了高模型质量。
DeepSeek采用纯强化学习(RL)方法,进一步使其与众不同。这些模型通过连续的反馈回路自主学习和改进,实现自我校正和适应性,这种机制显著提高了其解决问题的能力,特别是对于需要深入推理和逻辑分析的任务。
除了MoE,多头潜在注意力机制(MLA)提高了模型同时处理多个数据流的能力。通过将焦点分布在几个“注意力”头上,可以更好地识别上下文关系并处理细微的输入,即使在处理单个请求中的数万个Token时也是如此。
(五)用户评价
用户对DeepSeek-R1的高度评价主要集中在其思考过程的细腻性、自洽性和
全面性上,它能够提供深度和细节丰富的输出。
一些用户也指出了DeepSeek在某些方面的“用力过猛”,如生成过于复杂的语言或不适当的用词,特别是针对特定受众(如儿童)的内容。
DeepSeek面临的技术挑战包括如何进一步优化模型的性能、降低成本的同
时保持高效率,以及克服可能存在的幻觉和偏差问题。
DeepSeek公司正在专注于增强其“DeepThink+Web”搜索的功能,以实现实时在线查找能力。此外,还考虑开发针对特定行业的定制化模型,以及建立全球合作伙伴关系。
二、关于DeepSeek影响的分析
与DeepSeek基本信息相对的,是其所产生的巨大影响。这些影响中有哪些
是短期性的,哪些可能是长期性的?
(一)对中美战略竞争的影响:“星际之门”计划
DeepSeek对中美战略竞争的影响,首先表现在对美国“星际之门”计划(theStargateproject)的影响。2025年1月22日,美国总统特朗普在白宫新闻发布会上宣布启动“星际之门”计划。这一计划被称为“21世纪AI时代的‘星球大战’计划”。
“星际之门”计划由软银、OpenAI、甲骨文等科技巨头联合推动,注资高达5000亿美元。该计划旨在建设先进的数据中心和配套基础设施,以支持人工智能技术的快速发展,预计在未来四年内完成。
DeepSeek出现后,一个显而易见的疑问是美国耗费5000亿美元的计划所完成的工作。中国人难道不能用500亿美元甚至更低的成本完成,乃至做得更好吗?这样一来,“星际之门”计划还有意义吗?因此特朗普评价道,DeepSeek的问世是一记“警钟”。
DeepSeek对“星际之门”计划的影响主要体现在技术竞争、市场情绪、政策与战略调整等方面。
首先,技术竞争方面,DeepSeek凭借其低成本、高性能的技术优势,给AI行业带来了新的竞争格局。“星际之门”计划的参与者可能会重新评估投资策略和技术方向,思考是否有更高效低成本的方式实现目标。例如,原本计划大量投入算力资源的企业可能会因DeepSeek的出现而调整策略,这增加了美国在人工智能领域的技术竞争压力。
其次,市场情绪方面,DeepSeek的发展吸引了市场的关注,使得投资者对高成本AI相关项目产生了怀疑。DeepSeek的市场预期和成本估值,会吸引更多投资者关注。
最后,政策与战略调整方面,DeepSeek的成功表明中国科研团队在有限条件下通过创新实现了弯道超车,这可能会促使美国政府重新评估“星际之门”计划的可行性和成本效益,进行政策与战略上的调整。
此外,抛开成本不说,马斯克质疑“星际之门”计划的融资情况。这一计划似乎没有与马斯克很好沟通。马斯克在社交平台发文说,“他们实际上没有钱”“软银能确保的资金远低于100亿美元”。这是暗指软银去年负债3.8万亿日元。马斯克还曾表示他“不信任”OpenAI的奥特曼。
美国《外交政策》(ForeignPolicy)上的文章《DeepSeek揭示了美中竞争的未来》(WhatDeepSeekrevealedaboutthefutureofU.S.-Chinacompetition)指出,DeepSeek的非凡成功引发了美国国家安全界的担忧,他们担心美国最先
进的AI产品可能再也无法与中国更廉价的替代品竞争。文章分析,美国一直在利用其对半导体供应链的控制,限制中国获取高端芯片。然而,DeepSeek取得的成功让一些人开始质疑,美国的芯片出口管制是否毫无作用,甚至适得其反。文章最后指出,如果美国和中国的AI模型都存在双方不确定如何控制的危险能力的风险,那么美国与中国领导层就此进行沟通则是国家安全的当务之急[1]。
(二)对中美科技竞争的影响
DeepSeek的问世,在科技界眼中,缩短了中美在AI上的差距。
Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI
差距非常小。
1..不仅是中美之争本身,还是开源、闭源之争
图灵奖得主、MetaAI首席科学家YannLeCun在社交媒体上表示:“DeepSeek的成功凸显了保持AI模型开源的价值,这样任何人都可以从中受益。这表明开源模式正在超越专有模式。”他认为:“当人们看到DeepSeek的表现,惊呼中国AI正在赶超美国,但这种解读有误。更准确的结论是,开源模型正在超越闭源系统。[2]”
《福布斯》杂志则指出,DeepSeek的开源策略可能重塑全球AI标准,推动中国成为开源模型的主导者之一。《自然》杂志评价称,R1的开放性远超闭源模型的“黑匣子”特性。
由于美国公司出于商业利益,更倾向闭源系统,这给利用开源系统的中国公司更多机会,特别是在打造科技生态系统方面的机会,而这是以往中国相对于美国的薄弱环节。支持这一看法的事实是,DeepSeek因开放吸引了开发界的热烈响应,很短时间内就衍生出600多个应用。当然,国内科技界也有人对此持怀疑态度,主要是基于以往的开源往往在应用中被当作自主技术保守(伪开源)的历史。
DeepSeek目前还没有完全商业化,一旦商业化,将面临如何处理技术开放与商业模式开放的关系的问题。如果处理得好,如将基础业务与增值业务充分分开,形成互补,那么中国在这方面将形成对美国的优势。当然,中国如果在打造包容技术与商业开放的制度环境(如反垄断政策环境)方面落后于美国,也会使技术与商业上的优势化为乌有。
2.DeepSeek对巨头的挑战
DeepSeek现在俨然具有了当年U盘替代软驱那种“同等功能、巨大价差”的
以小博大的势头。DeepSeek的崛起对现有的AI巨头如OpenAI、Meta等构成了挑
战,促使他们重新评估成本、战略和研究方法。
一是通过开源策略和低成本技术,DeepSeek为小型企业、研究人员和开发者提供了新的机遇。一旦形成良好开发生态,有可能重现当年谷歌取代雅虎的历史。DeepSeek目前已进入搜索技术领域,这要求百度打起十二分的精神来应对,懈怠就意味着出局。
二是随着用户采用率的增加和市场对AI能力需求的增长,DeepSeek有望继续在AI领域发挥颠覆性作用。公司可能会进一步优化模型性能、加强与硬件供应商的合作,并开发针对特定行业领域的定制化解决方案。
DeepSeek是通过开源技术、低成本策略和创新算法推动人工智能发展的中国初创企业,其成功不仅体现在市场表现上,还在于对AI社区的影响力,以及为小型企业和开发者提供的新机遇。随着未来的发展,DeepSeek有望在AI领域持续产生重大影响,并可能引领下一波变革性突破。同时,也要看到,DeepSeek的出现在中国不是偶然的。中国还有一批潜在的同类技术和公司即将浮出水面,包括阿里团队、李飞飞(华人)团队都已提出了初步的成果,共同推动AI的改朝换代。
3.DeepSeek对投资的影响
DeepSeek的初步成功,引发了人们对OpenAI、微软和其他公司所追求的投资计划的重大质疑。
首先对OpenAI来说,DeepSeek以极低的成本实现极高性能,让人们对OpenAI
投资回报能力产生怀疑。
将DeepSeek节俭、分散的创新,与OpenAI等其他开发商对集中、资源密集
型基础设施的依赖,进行了对比。
结果发现,打造一个世界水平AI模型,只需要投入巨头一个高管的年薪就可以做到,巨头动辄养着十几个、几十个这种价位的高管的合理性,就会遭到投资人普遍质疑,甚至会产生受骗的感觉。
可以想见,巨头内部现在慌作一团,即使为了保住工资,也有动机赶紧向投资人证明DeepSeek的种种不是。但问题是,如果与DeepSeek类似的小公司成批涌现时,想通过栽赃和甩锅来摆脱困境,将不会有效。
当然,有一点现在还看不清楚,这就是DeepSeek本身的资本模式。这家公司出身对冲基金。在DeepSeek这个案例中,对冲基金对AI的投入(包括包装与
炒作)是可以看清的;但AI的产出和商业化现在还没有发生,将会怎样,还有待观察。一旦演化成一个金融的故事,就会存在各种变数。从投资上,人们期待DeepSeek做实,而不要变成一个壳。
三、谁将取代DeepSeek:从一滴水看AI大海
作为专门研究人工智能的业内人士,还要跳出媒体与资本的喧嚣,用平常
心冷静观察DeepSeek,这样看出的门道自然有所不同。
(一)冷思考之一:DeepSeek是弯道超车还是换道超车?
人工智能的权威专家钟义信教授认为,DeepSeek还在传统轨道的同一个赛
道上,可以评价为“在同一个赛道上,DeepSeek以更优秀的技术超越了GPTo1”。
要看到在同一赛道弯道超车的局限。钟义信指出,DeepSeek的技术(主要是算法效率)比GPT更优秀,但是,两者的范式(科学观和方法论)是一样的。具体来说,两者的科学观都是把人工智能看作“人工脑”,两者的方法论都遵循“唯形式化”和“分而治之”。然而,研究人工智能所需要的真正科学观,是应该把人工智能看作“主体主导下的主体客体相互作用的信息生态过程”(即整体论)。
这是DeepSeek热中的一种冷思考。钟义信的观点无异于认为,DeepSeek与其追赶的OpenAI是同类,都是美国计算主义同一赛道上的赛手,区别只是一个跑了50步,一个跑了100步。
这与一般业内人士的见解(包括马斯克的见解)非常不一样,业内都是看到了开放与封闭路线的区别,看到微软收购OpenAI,使得OpenAI变成了一个忘记“初衷”的商业化工具。马斯克的不满很大程度也来自这里,而不是如特朗普认为的与“星际之门”计划中的某人“有仇”。不过在这里,钟义信进了一步,直指“初衷”本身存在的局限。
这涉及对人工智能本质的理解,属于一个更深的问题。现有AI主流坚持物质学科范式(强调客体计算,缺主体价值判断),这是其时代局限。这种局限在DeepSeek骨子里也有。未来取代它的,将是信息学科的范式,即强调客体与主体统一。从这个意义上说,下一步替代DeepSeek们的,将是克服主客二元论的AI新范式,由此开启换道超车。在前沿上,这一趋势的苗头在生成式AI中(如新生成主义,neo-enactivism)隐约可见。本周作出DeepSeek同类成果的李飞飞,其实就在这条路上,她的野心肯定不止于DeepSeek。
(二)冷思考之二:知还是行?
著名人工智能专家蔡恒进对DeepSeek的成就有一个独特的看法,认为
DeepSeek对巨头的冲击的意义不只在于成本,而在于模式。
蔡恒进说:“OpenAI现在走的路,就是把算力集中起来,把参数推上去来实现AGI,这实际上是世界的前景就变成很中心化的AI系统,然后这个系统会需要大量的资源、能量,还有芯片算力的集中。”而DeepSeek的发展是分布式计算的方向,这比业界一般的“开放-封闭”视野多了一个“集中-分布”角度。
蔡恒进同样主张主客一体的AI新范式,不满意计算主义的AI路线,认为“我们有人类或者生命的参与、有主观能动性”,要把这种主体性加入计算的客体性中。他具体提出了“认知坎陷说”,即一种加入布伦塔诺意




