大家好, 每天早上 7 点准时更新的 AI 热点资讯来啦!
aiopenminds 今日 AI 热点资讯如下:
1. 最强 AI 程序员 Genie 砸饭碗:84 秒跑通代码,像人一样思考,团队仅 5 人
继 Devin 之后,又一个 AI 软件工程师 Genie 被刷屏了 —— 它号称目前地表最强,已经可以像人一样思考和行动了!在权威榜单 SWE-Bench 中,Genie 以解决了 30.07% 问题的成绩夺得榜首,遥遥领先第二名 19.27%,解锁了提升 SOTA 的最大增幅 —— 57%。Genie 已经观察并学习人类程序员如何解决软件问题的次数达到了数百万次,这是任何一个人类程序员一辈子都无法达到的数量。但更令人意想不到的是,Genie 背后的团队 —— Cosine,才仅仅 5 人。
信息来源:IT之家
2. 首位“AI 科学家”问世:已独立生成 10 篇学术论文,还顺手搞了 AI 审稿人
史上首位“AI 科学家”,横空出世!一登场就一口气生成了十篇完整学术论文。从提出研究想法、检查创新性、设计实验、编写代码,到在 GPU 上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI 科学家”自动搞定。每篇论文的成本约为 15 美元(约 107.62 元)。这就是第一个用于自动化科学研究和开放式发现的综合 AI 系统,The AI Scientist。来自 Transformer 作者之一 Llion Jones 的创业公司:Sakana AI。
信息来源:IT之家
3. 阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型:自由互动,无需输入文本
阿里通义千问开源了 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。作为一个大规模音频语言模型,Qwen2-Audio 能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,有两种不同的音频交互模式:语音聊天和音频分析。官方在一系列基准数据集上进行了测试,Qwen2-Audio 超越了先前的最佳模型。
信息来源:IT之家
4. IBM 推出生成式 AI 网络安全助手
IBM 宣布在其托管威胁检测和响应服务中引入生成式 AI 功能,供 IBM 咨询的分析人员使用,从而协作客户推进和简化安全运营。全新的 IBM 咨询 Cybersecurity Assistant 基于 IBM 的数据和 AI 平台 watsonx 构建,旨在加快和改进对关键安全威胁的识别、调查和响应。生成式 AI 功能帮助客户将警报调查时间缩短了 48%。
信息来源:IT之家
5. 尴尬!ChatGPT官宣新模型,评论区翻车了…
OpenAI 宣布 ChatGPT 的新模型 GPT-4o 已实装,但评论区用户表示没有感觉到明显变化。一些用户认为新模型在硬指标上可能无法超越 Claude-3.5-Sonnet,而 OpenAI 可能采用了非直接方式发布。新版 ChatGPT 的变化主要体现在语气上更加人性化,且可能在安全护栏上有所增强。AI 越狱大师 Pliny 发现需要修改越狱提示词以破解新版模型。
信息来源:量子位
6. 豆包上线音乐生成 用户可一键生成词曲
字节跳动旗下智能 AI 助手豆包上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词,设定音乐风格、情绪及音色,便能快速生成一首约 1 分钟的词曲,每个人都能体验音乐创作和表达的乐趣。目前,豆包音乐生成功能提供民谣、嘻哈、R&B 等 11 种音乐风格,用户可选择男声或女声演唱。生成的声音,在吐字清晰度和流畅性上表现很好。
信息来源:量子位
aiopenminds 今日 AI 热点资讯如下:
1. 最强 AI 程序员 Genie 砸饭碗:84 秒跑通代码,像人一样思考,团队仅 5 人
继 Devin 之后,又一个 AI 软件工程师 Genie 被刷屏了 —— 它号称目前地表最强,已经可以像人一样思考和行动了!在权威榜单 SWE-Bench 中,Genie 以解决了 30.07% 问题的成绩夺得榜首,遥遥领先第二名 19.27%,解锁了提升 SOTA 的最大增幅 —— 57%。Genie 已经观察并学习人类程序员如何解决软件问题的次数达到了数百万次,这是任何一个人类程序员一辈子都无法达到的数量。但更令人意想不到的是,Genie 背后的团队 —— Cosine,才仅仅 5 人。
信息来源:IT之家
2. 首位“AI 科学家”问世:已独立生成 10 篇学术论文,还顺手搞了 AI 审稿人
史上首位“AI 科学家”,横空出世!一登场就一口气生成了十篇完整学术论文。从提出研究想法、检查创新性、设计实验、编写代码,到在 GPU 上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI 科学家”自动搞定。每篇论文的成本约为 15 美元(约 107.62 元)。这就是第一个用于自动化科学研究和开放式发现的综合 AI 系统,The AI Scientist。来自 Transformer 作者之一 Llion Jones 的创业公司:Sakana AI。
信息来源:IT之家
3. 阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型:自由互动,无需输入文本
阿里通义千问开源了 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。作为一个大规模音频语言模型,Qwen2-Audio 能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,有两种不同的音频交互模式:语音聊天和音频分析。官方在一系列基准数据集上进行了测试,Qwen2-Audio 超越了先前的最佳模型。
信息来源:IT之家
4. IBM 推出生成式 AI 网络安全助手
IBM 宣布在其托管威胁检测和响应服务中引入生成式 AI 功能,供 IBM 咨询的分析人员使用,从而协作客户推进和简化安全运营。全新的 IBM 咨询 Cybersecurity Assistant 基于 IBM 的数据和 AI 平台 watsonx 构建,旨在加快和改进对关键安全威胁的识别、调查和响应。生成式 AI 功能帮助客户将警报调查时间缩短了 48%。
信息来源:IT之家
5. 尴尬!ChatGPT官宣新模型,评论区翻车了…
OpenAI 宣布 ChatGPT 的新模型 GPT-4o 已实装,但评论区用户表示没有感觉到明显变化。一些用户认为新模型在硬指标上可能无法超越 Claude-3.5-Sonnet,而 OpenAI 可能采用了非直接方式发布。新版 ChatGPT 的变化主要体现在语气上更加人性化,且可能在安全护栏上有所增强。AI 越狱大师 Pliny 发现需要修改越狱提示词以破解新版模型。
信息来源:量子位
6. 豆包上线音乐生成 用户可一键生成词曲
字节跳动旗下智能 AI 助手豆包上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词,设定音乐风格、情绪及音色,便能快速生成一首约 1 分钟的词曲,每个人都能体验音乐创作和表达的乐趣。目前,豆包音乐生成功能提供民谣、嘻哈、R&B 等 11 种音乐风格,用户可选择男声或女声演唱。生成的声音,在吐字清晰度和流畅性上表现很好。
信息来源:量子位