inflection 2.5在3月7日发布,各项能力对标GP4提高如图。pi还推出了desktop版本。估计mac win linux都有,因为我下载到了一个linux的appimage,但是桌面版仍然不能语音,估计以后会。pi获取新闻的能力增强不少,
Pi now also incorporates world-class real-time web search capabilities to ensure users get high-quality breaking news and up-to-date information.
以下是图例翻译
MMLU: 多模态语言理解任务。
GPQA: 通用问题回答任务。
Big-Bench-Hard: 这是一个大型基准测试,包含各种困难的自然语言处理任务。
数学: 数学任务,例如求解方程和证明定理。
编码: 编码任务,例如编写代码和生成代码片段。
常识: 常识任务,例如回答有关世界知识的问题。
Pi now also incorporates world-class real-time web search capabilities to ensure users get high-quality breaking news and up-to-date information.
以下是图例翻译
MMLU: 多模态语言理解任务。
GPQA: 通用问题回答任务。
Big-Bench-Hard: 这是一个大型基准测试,包含各种困难的自然语言处理任务。
数学: 数学任务,例如求解方程和证明定理。
编码: 编码任务,例如编写代码和生成代码片段。
常识: 常识任务,例如回答有关世界知识的问题。