以上内容由均由人工智能模型辅助生成,其生成内容的准确性和完整性无法保证,也不代表通义的态度或观点。

12月23日AI行业日报:OpenAI新模型GPT-5研发遇阻;谷歌Gemini新增PDF快速总结功能;微软Phi-4小模型数学超越GPT-4o

日报速递
12-23 10:58491

24小时精选 ⭐️

01.GPT-5研发遇阻,OpenAI面临挑战

02.AMD显卡命名再变,RX 9070或将登场

03.谷歌Gemini新增PDF快速总结功能

04.图森未来转型AIGC游戏,陈默谈困境

05.微软Phi-4小模型数学超越GPT-4o


01

GPT-5研发遇阻,OpenAI面临挑战

近期,《华尔街日报》报道指出,OpenAI在开发下一代大型语言模型GPT-5的过程中遇到了显著的困难。该项目已经进行了超过18个月,但目前取得的成果尚未达到与其巨额成本相匹配的水平。据报道,OpenAI至少完成了两次大规模训练,每次训练都需要数月时间来处理大量数据。尽管GPT-5的性能有所提升,但其进步幅度并未足以证明维持该模型运行所需的高额成本是合理的。面对这些挑战,OpenAI正在探索新的方法,如通过推理来提高模型的智能水平。然而,目前尚不清楚GPT-5何时能够正式发布,甚至是否能够成功推出。

圆桌评论 💬

一位资本合伙人指出,GPT-5开发过程中遇到的显著困难确实反映了当前AI技术在追求更高智能水平时遇到了瓶颈。“即使我们已经进入了一个全新的领域,我们仍然知道GPT-5会更好,GPT-6将会更加惊人。然而,变化发生得如此之快,以至于我们几乎不愿意承认我们所处的现状。”他补充道。OpenAI面临的挑战不仅仅是技术上的,还有经济和组织层面的问题。据报道,GPT-5的训练成本高达数亿美元,而其性能提升却未能达到预期。这位合伙人认为,这就像你花了一大笔钱买了一辆豪华跑车,结果发现它只能开到80公里每小时,让人怀疑这笔投资是否值得。


02

AMD显卡命名再变,RX 9070或将登场

近日,关于AMD下一代显卡的命名再次引发关注。根据最新消息,AMD计划跳过原本预期的RX 8000系列,直接推出基于RDNA4架构的RX 9000系列显卡。其中,高端型号可能命名为RX 9070,并且将有XT版本。这一命名变化不仅让许多用户感到困惑,也显示出AMD在产品线规划上的独特策略。

圆桌评论 💬

一位资深工程师指出,AMD此次跳过RX 8000系列直接推出RX 9000系列的决策,确实反映了其在市场策略上更加激进的态度。“这种命名方式不仅能够吸引用户的注意力,还能在心理上给人一种产品性能大幅提升的感觉。”他进一步解释道。“AMD总是喜欢在命名上玩一些小花样,这既是一种营销手段,也是一种对竞争对手的心理战。”例如,NVIDIA几十年如一日地稳定命名,而AMD则不断变换命名规则,从HD2000-7000系列到R9/R7/R5再到RX400/500系列,甚至出现了RadeonVII这样的特殊命名。这种频繁的变化虽然有时会让用户感到困惑,但也成功地制造了话题和讨论度。


03

谷歌Gemini新增PDF快速总结功能

近日,谷歌为其AI助手Gemini推出了一项新功能——“询问此PDF”,该功能现已开始陆续推送给部分用户。这项功能集成在最新版的Files by Google应用中,允许用户通过长按电源按钮或使用唤醒词“嘿,Google”来触发Gemini覆盖层,从而对PDF文件进行快速总结或解答问题。值得注意的是,要使用这一功能,用户需要订阅Gemini Advanced服务,并确保设备运行Android 15系统且已将Gemini设置为默认助手。这一更新进一步增强了Gemini在日常办公和学习中的实用性,使得处理复杂文档变得更加便捷高效。

圆桌评论 💬

一位资深工程师指出,Gemini新增的PDF快速总结功能将显著改变人们处理文档的工作流程,并提高整体工作效率。“技术的进步往往能带来工作方式上的革新,”他强调道,“就像2000年谷歌拼写校正器推出时的情景,那是一个里程碑式的时刻。”他认为,Gemini的新技能不仅仅是提高了效率那么简单,更是向着更加智能化、个性化的信息处理方向迈进了一大步。尽管这项新功能需要订阅高级服务并依赖于特定的操作系统版本,但考虑到现代消费者对于高效便捷工具的需求日益增长,以及对最新科技的好奇心驱使,会有相当一部分用户愿意为此付费甚至升级操作系统


04

图森未来转型AIGC游戏,陈默谈困境

全球自动驾驶第一股图森未来经历了从2021年IPO时85亿美元估值到2024年初退市的剧变。面对管理层动荡、美国监管调查、业务收缩及裁员等挑战,图森未来在2024年8月宣布进入生成式AI应用领域,计划打造基于《三体》的动画电影及视频游戏。联合创始人陈默认为,L4级自动驾驶要实现商业化,在当前技术和市场环境下遥遥无期,因此转向动漫游戏是看中了该市场的盈利能力和持续增长潜力。他强调,AI技术应以降本增效为目的,而不仅仅是追求技术突破。尽管图森未来仍保留部分自动驾驶业务,但已转变为技术授权模式,主要通过出售数据和专利来维持公司发展。

圆桌评论 💬

一位科技公司CEO指出,图森未来从自动驾驶转向AIGC游戏领域,确实反映了整个行业在商业化道路上遇到了难以克服的技术或市场障碍。他认为,“L4级别的自动驾驶要真正取代人工驾驶,不仅需要极高的技术可靠性,还需要在成本上具备竞争力,但目前无论是传感器的成本还是算法的成熟度,都使得这一目标遥不可及。”他进一步解释道,特斯拉虽然通过使用昂贵的传感器来提升模型性能,但最终部署时只采用基于视觉的方案,这种策略并不适用于所有公司。对于图森未来而言,面对高昂的研发成本和不确定的市场需求,转向更具有盈利潜力的AIGC游戏领域是一个务实的选择。


05

微软Phi-4小模型数学超越GPT-4o

微软最新发布的140亿参数小模型Phi-4,在数学性能上取得了显著突破,击败了GPT-4o和GeminiPro1.5等大型模型。Phi-4在GPQA和MATH基准测试中表现出色,特别是在2024 ACM数学竞赛问题上达到了91.8%的准确率。这一成就主要归功于其创新的训练方法,包括使用40%的合成数据、精选的原生数据以及领先的后训练技术。Phi-4的成功不仅展示了小模型在特定任务上的潜力,还挑战了业界关于“数据墙”的观点。目前,该模型已在微软Azure AI Foundry上提供,并将于下周在HuggingFace上线。

圆桌评论 💬

一位AI科学家指出,Phi-4在数学性能上的突破确实预示着小模型未来有可能在更多领域挑战甚至超越大模型的地位。“模型大小并不是决定其能力的唯一因素,关键在于如何训练和优化这些模型。”他进一步解释道,Phi-4通过巧妙地利用合成数据和先进的后训练技术,在STEM领域的表现上实现了对GPT-4o等大型模型的超越,这就好比是用更少的食材做出了一道更加美味的菜肴。此外,这位科学家强调,合成数据占比达到40%这一创新训练方法确实预示着未来AI模型训练将更加依赖于高质量的合成数据,但这并不意味着原始数据会完全被取代。