一个神秘的人工智能模型引发了开发者们的热烈讨论：这会是 DeepSeek 的最新

一个神秘的人工智能模型引发了开发者们的热烈讨论：这会是 DeepSeek 的最新力作吗？北京，3 月 18 日 (路透社) —— 上周，一个强大的人工智能模型悄然现身于一个开发者平台，引发了众人的猜测，中国创业公司 DeepSeek 或许在正式发布前，正悄悄对其下一代系统进行测试。这款名为 Hunter Alpha 的免费模型于 3 月 11 日出现在人工智能网关平台 OpenRouter 上，没有标注任何开发者信息，后来被该平台称为 “隐形模型”。在路透社的测试中，猎人阿尔法 (Hunter Alpha) 聊天机器人自称 “一个主要用中文训练的中国人工智能模型”，还表示其训练数据截至 2025 年 5 月，这与 DeepSeek 自家聊天机器人报告的知识截止点一致。然而，当被问及创建者时，该系统拒绝透露开发者身份。“我只知道我的名字、参数范围和上下文窗口长度。” 聊天机器人说道。更多路透社图片：在 2025 年 1 月 29 日拍摄的这张插图中能看到 DeepSeek 的标志。路透社 / Dado Ruvic/Illustration/File PhotoBy Eduardo Baptista 北京，3 月 18 日 (路透社) —— 上周匿名出现在开发者平台上的这个强大人工智能模型引发了猜测，中国创业公司 DeepSeek 可能在正式发布前悄悄测试其下一代系统。这款名为 Hunter Alpha 的免费模型于 3 月 11 日出现在人工智能网关平台 OpenRouter 上，无开发者署名，后被平台描述为 “隐形模型”。在路透社的测试中，猎人阿尔法 (Hunter Alpha) 聊天机器人称自己是 “一个主要用中文训练的中国人工智能模型”，并表示训练数据截止到 2025 年 5 月，和 DeepSeek 自家聊天机器人报告的知识截止点相同。但当被问及其创建者时，系统拒绝透露开发者身份。“我只知道我的名字、参数范围和上下文窗口长度。” 聊天机器人说。 DeepSeek 和 OpenRouter 都未明确该模型的创建者，也未回应记者的置评请求。亨特阿尔法的个人资料页面将其描述为一个 1 万亿参数的模型，这意味着它用大约一兆个可调整的值进行训练，这些值决定了系统处理语言和产生响应的方式。参数更多的模型通常需要更强的计算能力来运行。该系统还公布了一个多达一百万个令牌的上下文窗口，用于衡量人工智能模型在一次交互中能处理或记住的文本量。标记大致相当于一小段文本，比如一个单词的一部分。负责人工智能代理系统开发的工程师纳比尔・豪阿姆 (Nabil Haouam) 表示：“Hunter Alpha 的 100 万令牌上下文与推理能力和自由访问相结合，十分出众。” 他还补充道：“大多数具有这种上下文窗口的前沿模型都有高昂的实际成本。” 这些规格与中国媒体对 DeepSeek 下一代 V4 机型的预期相似。中国媒体报道称，该机型最早可能在 4 月上市。和许多中国竞争对手一样，DeepSeek 资金充裕，但由于其母公司是一家定量对冲基金，而非科技企业集团，它的结构与众不同。尽管这种关联无法建立直接联系，但却加剧了开发者的猜测，即这个匿名系统可能是 DeepSeek 即将发布版本的早期测试版。 “思维链模式可能是最明显的信号。” 人工智能工程师丹尼尔・德伍斯特 (Daniel Dewhurst) 在谈及人工智能模型的原因时表示。

群发资讯网

一个神秘的人工智能模型引发了开发者们的热烈讨论：这会是 DeepSeek 的最新

热门分类

一个神秘的人工智能模型引发了开发者们的热烈讨论：这会是 DeepSeek 的最新

猜你喜欢

中国大模型卷向全球：美国程序员疯狂白嫖，底层逻辑全变了

日本乐天AI大模型3.0在发布后不到12小时，就被技术玩家发现其核心架构、参数规

外媒：美国人工智能与机器人企业高管在国会听证会上警告，中国人形机器人发展速度惊人

英伟达要花260亿美元搞AI大模型，这是什么概念，OpenAI训练GPT-4花了

全球AI大模型排名大概就是这个排列，很遗憾腾讯，百度目前掉队了，而除了中美，其他

程序员圈估计要炸了，有人把全网从零开始造轮子教程都汇总到了一起，这个叫自

不等了，美国派人来华近日，美国科技公司派出了一个团队，专门奔赴中国考察一种对

热门分类