TOKYO, Feb 02 (News On Japan) - 中国的人工智能产业因Deepseek的崛起而引起轰动,这一革命性人工智能模型被认为可与全球顶级AI系统媲美。
尽管Deepseek的性能与顶级模型相当,但其开发成本却只有极小的一部分,引发了对其对全球AI格局影响的讨论,以及美中关系可能再次紧张的担忧。
这一变革被称为“Deepseek震撼”,让人想起1957年的“斯普特尼克震撼”,当时苏联成功发射了世界上第一颗人造卫星,使美国在太空竞赛中被迫奋起直追。如今,Deepseek的AI技术进步令业界震惊,使中国成为这一领域的强劲竞争者。Deepseek公司成立于2023年,其创始人连文峰出生于1985年,曾是一名对冲基金企业家。在凭借算法驱动的股票交易取得成功后,他转向人工智能领域,并最终开发出了Deepseek的先进AI模型。
Deepseek AI最引人注目的特点是其快速的开发周期和极低的成本。核心模型仅用两个月完成,总开发费用为9亿日元——不到OpenAI开发ChatGPT成本的十分之一。然而,其性能据称可与2023年9月发布的ChatGPT版本相媲美。与西方的AI模型类似,Deepseek AI可以进行互动对话并回答各种问题。例如,当被问及“如何用不超过30个字描述与前美国总统特朗普的谈判策略”时,该AI回答:“保持坚定立场,以取得谈判优势。”然而,作为一款中国开发的AI,它也有特定的限制。当被询问关于1989年天安门事件的问题时,该AI拒绝回答,而是回复道:“无法提供答案,请更换话题。”
Deepseek低成本的关键因素之一在于其创新的AI训练方法。该公司利用了公开可用的开源AI模型,使其无需完全依赖专有技术来开发系统。通过“教师-学生”模式,Deepseek AI通过向更高级的外部AI模型不断提问进行学习,其中高级AI模型充当“教师”,而Deepseek的较小型AI作为“学生”。这一方法使Deepseek避免了对昂贵的高性能半导体芯片的依赖,从而降低了开发成本。此外,Deepseek还将其AI模型开源,使研究人员和企业能够对其进行改进和定制。AI专家安野贵博指出,这一突破可能会推动AI技术的普及,使资金有限的企业也能开发高性能AI。他还强调,Deepseek AI可以成为开发新应用的基础,以满足不同的特定需求。
尽管Deepseek取得了令人瞩目的成就,但其也面临数据不当使用的指控。据彭博社报道,该公司可能未经授权使用了其他企业的专有数据来训练其AI模型。美国政府官员也对此表示担忧,认为可能存在“美国知识产权被盗窃”的情况。在美中科技竞争日益激烈的背景下,Deepseek的崛起可能会进一步加剧地缘政治紧张局势。
当被问及这一争议时,Deepseek强调国际合作的重要性。“通过国际合作与对话,有助于缓解紧张局势,”该公司表示。随着全球AI竞赛的加速,Deepseek的崛起标志着一个转折点,展现了中国在前沿技术方面的日益强大,并重塑了人工智能领域的竞争格局。
Source: KTV NEWS