DeepSeek火爆全球,中国撬动全球人工智能发展新范式
作者:    浏览:12503
2025年初,全球人工智能领域的聚光灯突然转向一家名不见经传的中国初创公司——杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。这家企业凭借一款名为“DeepSeekV3”的大语言模型引发全球轰动。

DeepSeek的故事始于中国杭州的一间共享办公室,深度求索公司成立于2023年7月17日,由知名量化资管巨头幻方量化创立。创始团队由梁文锋等几位年轻科学家组成,创业初期立下DeepSeek的理想主义:开源、降本与AI普惠。

2024年1月5日发布DeepSeek LLM,这是深度求索的第一个大模型。2024年12月26日晚,DeepSeek正式上线全新系列模型DeepSeek-V3首个版本并同步开源。这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练。在没有预热、没有炒作的情况下,“DeepSeek-V3”模型迅速走红,达到了令人咋舌的程度。

官方数据显示,该模型多项评测成绩超越了头部开源模型,它在性能上与世界顶尖的闭源模型GPT-4o不分伯仲。令AI界感到不可思议的是这款大模型的训练成本极其低廉。官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。而GPT-4o的模型训练成本约为1亿美元。凭借独有的技术架构与算法优化,DeepSeek大幅削减模型研发与运维成本,实现低成本高回报。以达成与OpenAI o1模型相当性能为例,耗费资金仅为其3%-5%,这引起了硅谷的巨大轰动。要知道,OpenAI一直在巨亏——仅去年就“烧”掉了50亿美元。其2023年至2028年预计累计亏损高达440亿美元,2026年的支出可能攀升至95亿美元。

Meta CEO扎克伯格则评价说,DeepSeek展现出的技术实力和性能令人印象深刻,并指出中美之间的AI差距已经微乎其微。

Meta首席AI科学家Yann Lecun表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。他在社交媒体直言:“西方公司该醒醒了,中国同行正在定义新的游戏规则。”

前谷歌首席执行官埃里克·施密特表示,DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以用更少的资源与大型科技公司竞争。

微软首席执行官萨提亚・纳德拉在瑞士达沃斯的世界经济论坛上表示:“DeepSeek的新模型令人印象深刻,尤其是在如何高效开发开源模型并进行推理计算方面,它的计算效率非常出色。我们应当非常、非常认真地对待来自中国的这些技术进展。”

英伟达在声明中指出,DeepSeek在人工智能技术的创新与应用方面,展现了难以置信的成就。

DeepSeek的确在全球技术领域竖起了一个重要的里程碑。中国科学家以超人的智慧应对美国对中国高端芯片的封杀,以低功能芯片和低成本杀入世界顶级AI大模型的巅峰。

DeepSeek以令人称奇的使用体验带来强劲的扩散效应,在苹果AppStore应用商店美国区登顶,超越了长期霸榜的ChatGPT。有报道说,目前160多个国家或地区下载榜同时登顶!仅俄罗斯就有超过500万人下载使用。随着人们下载使用体验感的提升,相信这款大模型的全球下载量将越来越多,前途不可限量。

DeepSeek异军突起,实力尽显锋芒。中国用户面对DeepSeek这种强大的人工智能,从质疑、体验到全民狂欢似乎是一夜之间。的确,AI已经把未来送到了每个人的家门口。今日头条和小红书等各大平台上处处都是使用这一大模型的体验和指令输出范例,称奇者比比皆是。

DeepSeek的成功,不仅象征着中国在AI领域科技实力的大幅提升,更显现着中国在全球未来科技竞争中话语权份量在增强。《金融时报》将其描述为“震惊国际科技界的黑马”,认为其性能已与资金雄厚的OpenAI等美国竞争对手的模型相媲美。《经济学人》表示,认为中国AI技术在成本效益方面的快速突破,已经开始动摇美国的技术优势。

BBC则报道称,中国新推出的人工智能应用程序DeepSeek以惊人的速度震撼了科技行业、市场以及美国在人工智能领域的优越感。

据报道,DeepSeek大模型遭遇了史上最大规模网络攻击,溯源显示攻击源来自美国。1月28日凌晨,DeepSeek官网的服务状态页面发布了一份紧急声明,指出其线上服务近期遭遇了大规模的恶意攻击。由于此次攻击的影响,新用户的注册过程变得异常繁忙,甚至有时无法完成,DeepSeek迅速调整了服务器的配置和策略,加强了网络安全防护,有效地抵御了攻击的进一步蔓延。他们与多家知名的网络安全公司建立了紧密的合作关系,共同应对这次攻击。

DeepSeek正全力加快AI智能生态的发展和丰富,加快从工具到生态的跃进。近日,DeepSeek团队正式发布了两款多模态框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能,不仅展示了DeepSeek在技术创新方面的实力,也为用户提供了更加多样化和高效化的AI服务。

从“无名之辈”到“现象级AI公司”,从技术自信到生态布局,DeepSeek的崛起已超越商业范畴。以技术奇点重新定义AI赛道的底层逻辑和大模型范式,已经打破从技术、产业到资本市场对AI发展的固有认知,掀起了一场前所未有的技术变革,它正在演绎的是未来科技智慧之战,或者说是技术理想主义与国家使命的演进。中国科技正在为人类命运共同体提供数字时代的创新范例,这是一场技术理想主义与国家宏大战略的共振,更是一个古老文明在智能时代的强势宣言。

AI来自于人类的智慧,并将催化智慧之光。智能文明时代需要更多的深度求索公司,相信中国科技界会涌现出更多的创新“黑马”!

来源:中国日报网

本文作者:

1、本文是中教全媒体原创文章,转载此文章请注明出处(中教全媒体)及本文链接。
2、本文链接:http://www.cedumedia.com/i/46398.html
3、如果你希望被中教全媒体报道,请发邮件到 new@cedumedia.com告诉我们。

来源:中教全媒体

参与讨论 0

评论前必须登录!