您已经看过
[清空]
    fa-home
    当前位置:网站首页 > 热点资讯 >

    OpenAI新功能太强大,大幅增强工具调用

    作者:河北游戏网 热点资讯 2024-12-070

    OpenAI新功能太强大,大幅增强工具调用

    OpenAI新功能太强大,大幅增强工具调用

    在12月6日拂晓时分,OpenAI公司举行了“12天12场直播”活动的首秀,期间高调推出了升级版的推理大模型o1,以及全新的进阶模式。同时,也亮相了一项定价为每月200美元(约合人民币1450元)的Pro订阅服务,该服务为用户提供了畅享权限,能够大规模接触该公司的一系列顶尖模型和工具。

    Pro订阅套餐中,用户可享受到无限制使用o1模型及其缩小版o1-mini,以及功能强大的**-4o和类似人类的高级语音模式Advanced Voice。更引人注目的是,该服务独家提供的o1 pro mode,它通过调配更多计算资源,实现了对复杂问题的深度思考和更精准的回答。公司还计划为Pro订阅追加更多计算密集型的高级生产力功能。

    与早期预览版相比,当前版本的o1模型在处理棘手现实问题时,错误率降低了34%,处理速度也提升了50%。例如,当面对“列举2世纪罗马皇帝的名字、任期和主要成就”这一难题时,o1模型仅用14秒便给出答案,而预览版却需34秒,且性能较弱的**-4o模型在处理此类问题时常出现错误。

    o1模型目前支持图像输入功能,用户甚至可以在提问时附上手绘的示意图,如询问关于太空数据中心散热的问题。该公司计划在未来数月内,进一步扩展至支持网页浏览和文件上传等功能。

    在数学、科学和编码等挑战性领域,o1 pro mode的表现在各类机器学习基准测试中均超越了o1和o1-preview。在数学测试中,o1 pro mode得分高达86,而o1和o1-preview分别为78和50;在编码领域,o1 pro mode得分90,领先于o1的89和o1-preview的62;在回答高级科学问题的测试中,o1 pro mode得分为79,相比之下,o1和o1-preview分别为76和74。

    为了凸显o1 pro mode的稳定性,该公司提升了评估标准,要求模型在四次尝试中均需给出正确答案。即便在这样严格的评判下,o1 pro mode的表现依然优于其他版本,显示出在数学、编码和科学问题解答上的明显优势。

    Pro订阅服务的推出,以每月200美元的价格,解锁了高级模式的使用权限,比Plus订阅的定价高出十倍。用户支付该费用后,不仅能够无限制地使用o1模型,还能享受到o1 mini和高级语音模式,以及专享的o1 pro模式。这一模式通过深入思考,为最具挑战性的问题提供最优解。未来,该服务还将不断升级,添加更多强大的功能。

    在一场引人入胜的演示中,该公司展示了如何利用o1 pro mode筛选符合条件的蛋白质,并免费向10名专注于孤儿病、癌症、痴呆等领域的医学研究人员提供Pro订阅,展现了该服务的目标受众。发布会尾声,奥尔特曼预告了次日将有更多对开发者极具价值的内容发布。

    OpenAI新功能太强大,大幅增强工具调用》由《河北游戏网》整理呈现,请在转载分享时带上本文链接,谢谢!
    Copyright © 2018-2024 河北游戏网 All Rights Reserved.
    冀ICP备19026611号 网站地图