随着AI领域竞争的加剧,中国零售巨头阿里巴巴推出了QwQ-32B-Preview,据称其性能优于OpenAI的o1系列。
据报道,最新模型在某些特定基准测试中优于 OpenAI 的 o1-preview 和 o1-mini 模型,例如 AIME 和 MATH 测试,这些测试评估 AI 模型在逻辑难题和数学问题中的表现。
阿里巴巴已经制作了QwQ-32B-Preview供下载。
据这家零售巨头称,与 ChatGPT-4 和 Claude 3.5 等普通大语言模型 (LLM) 相比,阿里巴巴的新模型能够解决复杂的问题。
Benzinga 的一篇文章指出,QwQ-32B-Preview 是少数几个在宽松许可证下可用的产品之一,允许用户下载和使用它。该模型现已登陆AI开发平台Hugging Face。
然而,阿里巴巴发布了该模型的某些组件,以限制对该模型的完全复制或对其工作的深入了解。
阿里巴巴的最新模型拥有 325 亿个参数,可以处理多达 32,000 字的提示。凭借该模型的强大功能和半开放的可访问性,阿里巴巴的新进入者为人工智能推理技术的变革性飞跃奠定了基础。
阿里巴巴的透明声明强调了其模型的复杂性,而 OpenAI 却对其参数计数保密。
该模型的出现正值 OpenAI 在人工智能领域取得重大进展之际。 10 月份,OpenAI 在一轮成功的融资后估值跃升至 1570 亿美元。
据报道,本周早些时候,软银集团 SFTBF 通过 15 亿美元的员工股份收购增加了其在 ChatGPT 制造商的股份。
据称,在美国司法部要求其剥离 Google Chrome 浏览器的压力下,OpenAI 还正在探索开发自己的网络浏览器,以挑战 Alphabet 的子公司 Google Chrome 浏览器。
阿里巴巴承认该模式也存在缺陷
尽管它具有一些独特的优势,但新模型也有局限性。据该组织称,QwQ-32B-Preview 存在意外语言切换等问题,这可能会让用户感到困惑。该模型在需要常识推理的任务中也表现不佳,这在许多人工智能系统中很常见。
根据 AutoGPT ,该模型可能会陷入逻辑循环,从而延迟响应。
尽管有缺点,但其推理能力使其能够进行事实检查,从而减少错误,但增加了解决时间。
通过任务推理和规划步骤,阿里巴巴的模型避免了一些影响传统人工智能系统的陷阱。但这种方法需要额外的时间,这可能会限制实时应用。
据Benzinga称,QwQ-32B-Preview的回应符合 中国监管标准 ,避免了政治敏感话题。
例如,像台湾这样的政治敏感话题会给出与中国政府立场一致的回应。
此外,有关天安门广场等事件的提示没有出现任何响应,显示了该模型的谨慎设计。
虽然这对于中国市场来说可能是理想的选择,但它也可能限制其在全球市场上的吸引力。然而,该模型是进入推理人工智能领域的重要一步。虽然其局限性可能会缩小其全球吸引力,但其逻辑和半开放性质等其他组件使其成为 OpenAI 的重要竞争对手。
据 AutoGPT 称,QwQ-32B-Preview 强调了这一令人兴奋的前沿领域的潜力和挑战,世界各地的人工智能实验室正在努力完善推理技术。
搜索...


