群发资讯网

一个神秘的人工智能模型引发了开发者们的热烈讨论:这会是 DeepSeek 的最新

一个神秘的人工智能模型引发了开发者们的热烈讨论:这会是 DeepSeek 的最新力作吗? 北京,3 月 18 日 (路透社) —— 上周,一个强大的人工智能模型悄然现身于一个开发者平台,引发了众人的猜测,中国创业公司 DeepSeek 或许在正式发布前,正悄悄对其下一代系统进行测试。这款名为 Hunter Alpha 的免费模型于 3 月 11 日出现在人工智能网关平台 OpenRouter 上,没有标注任何开发者信息,后来被该平台称为 “隐形模型”。 在路透社的测试中,猎人阿尔法 (Hunter Alpha) 聊天机器人自称 “一个主要用中文训练的中国人工智能模型”,还表示其训练数据截至 2025 年 5 月,这与 DeepSeek 自家聊天机器人报告的知识截止点一致。然而,当被问及创建者时,该系统拒绝透露开发者身份。“我只知道我的名字、参数范围和上下文窗口长度。” 聊天机器人说道。 更多路透社图片:在 2025 年 1 月 29 日拍摄的这张插图中能看到 DeepSeek 的标志。路透社 / Dado Ruvic/Illustration/File PhotoBy Eduardo Baptista 北京,3 月 18 日 (路透社) —— 上周匿名出现在开发者平台上的这个强大人工智能模型引发了猜测,中国创业公司 DeepSeek 可能在正式发布前悄悄测试其下一代系统。这款名为 Hunter Alpha 的免费模型于 3 月 11 日出现在人工智能网关平台 OpenRouter 上,无开发者署名,后被平台描述为 “隐形模型”。 在路透社的测试中,猎人阿尔法 (Hunter Alpha) 聊天机器人称自己是 “一个主要用中文训练的中国人工智能模型”,并表示训练数据截止到 2025 年 5 月,和 DeepSeek 自家聊天机器人报告的知识截止点相同。但当被问及其创建者时,系统拒绝透露开发者身份。“我只知道我的名字、参数范围和上下文窗口长度。” 聊天机器人说。 DeepSeek 和 OpenRouter 都未明确该模型的创建者,也未回应记者的置评请求。亨特阿尔法的个人资料页面将其描述为一个 1 万亿参数的模型,这意味着它用大约一兆个可调整的值进行训练,这些值决定了系统处理语言和产生响应的方式。参数更多的模型通常需要更强的计算能力来运行。该系统还公布了一个多达一百万个令牌的上下文窗口,用于衡量人工智能模型在一次交互中能处理或记住的文本量。标记大致相当于一小段文本,比如一个单词的一部分。 负责人工智能代理系统开发的工程师纳比尔・豪阿姆 (Nabil Haouam) 表示:“Hunter Alpha 的 100 万令牌上下文与推理能力和自由访问相结合,十分出众。” 他还补充道:“大多数具有这种上下文窗口的前沿模型都有高昂的实际成本。” 这些规格与中国媒体对 DeepSeek 下一代 V4 机型的预期相似。中国媒体报道称,该机型最早可能在 4 月上市。 和许多中国竞争对手一样,DeepSeek 资金充裕,但由于其母公司是一家定量对冲基金,而非科技企业集团,它的结构与众不同。尽管这种关联无法建立直接联系,但却加剧了开发者的猜测,即这个匿名系统可能是 DeepSeek 即将发布版本的早期测试版。 “思维链模式可能是最明显的信号。” 人工智能工程师丹尼尔・德伍斯特 (Daniel Dewhurst) 在谈及人工智能模型的原因时表示。