一、 Scaling Law继续?MIT发现还有把‘测试时训练’的路可走
- 挑战与机遇:OpenAI的Scaling Law面临挑战,数据供应减少影响了模型质量提升;
- 测试时训练(TTT):MIT研究了测试时训练(TTT),发现其在few-shot学习和抽象推理中效果显著;
- 技术突破:TTT结合增强的数据生成和模型适应器,显著提高了语言模型在ARC任务中的表现,突破了现有技术水平。
二、 港中文、上海AI Lab、腾讯两张3090跑SearchGPT并开源**
- 视觉语言模型融合:Vision Search Assistant(VSA)结合视觉语言模型和Web搜索技术,可回答关于未见图像或新概念的问题;
- 性能超越:VSA在图像描述、Web知识检索和推理方面表现出色,超过了现有技术如Perplexity.ai Pro和GPT-4-Web;
- 开源与应用潜力:开源版本可通过两张RTX3090复现,潜力广泛,包括在视频、3D模型和声音等领域的应用。
三、 *开源代码模型更新,320亿参数Qwen2.5-Coder新模型发布
- 新编程模型:Qwen2.5-Coder-32B新开源编程模型发布,在多个基准测试中超越GPT-4o;
- 语言支持与性能:该模型支持92种编程语言,并在代码生成、修复、推理等方面表现出色;
- 易用性与关注度:开源版本提供多种尺寸,适合开发者微调或直接使用,具有高易用性,受到广泛关注。
四、 苹果也在押注的智能眼镜正在爆发,百度发布小度 AI 眼镜**
- 实用功能与市场竞争力:百度发布了首款搭载中文大模型的AI眼镜,具备多种实用功能,如边走边问、实时翻译等;
- 舒适性与硬件规格:小度AI眼镜强调长时间佩戴的舒适性与高硬件规格,目标成为智能眼镜市场的竞争者;
- 智能体技术的应用:另外还展示了智能体技术的应用,强调无代码工具、智能体协作等新兴AI技术。
五、 AI辅助披头士乐队《Now and Then》获得格莱美奖两项提名**
- 音乐与AI的结合:披头士乐队的《Now and Then》获得了2025年格莱美奖两项提名,分别为年度唱片和最佳摇滚表演;
- 技术重制经典:AI技术帮助从约翰·列侬的原始录音中提取嗓音,成功重制了这首曲目;
- 历史性提名:这是披头士乐队几十年来首次获得格莱美提名,也是乐队第四次进入年度唱片提名名单。
六、 扩散模型失宠?端侧、非自回归图像基础模型Meissonic登场**
- 新型图像生成模型:Meissonic是一款新型非自回归掩码图像生成模型,旨在高效生成高分辨率图像并超越传统扩散模型SDXL;
- 技术提升:该模型通过创新的Transformer架构、位置编码和特征压缩层,提升生成效率和图像质量,适配消费级硬件;
- 性能超越:Meissonic在图像质量、生成速度和推理效率上超越了现有技术,特别适合端侧设备应用。
七、 DeepMind突然开源AlphaFold 3,加速科学发现与药物研发**
- 科学发现新工具:DeepMind开源了其最新AI蛋白质预测工具AlphaFold 3,推动科学发现与药物研发;
- 复杂相互作用模拟:AlphaFold 3能够模拟蛋白质、DNA、RNA和小分子间的复杂相互作用,显著提升预测效率与准确性;
- 全球科研加速:尽管仍存在一些局限,AlphaFold 3的开源为全球科研加速提供了强大工具,将推动计算生物学的新应用。
八、 英国20%医生正使用ChatGPT,获取医疗诊断、医疗建议等**
- ChatGPT在医疗领域的应用:20%的英国医生正在使用生成式AI工具,ChatGPT使用率最高,主要用于鉴别诊断和治疗建议;
- 应用广泛与风险并存:生成式AI在医疗领域的应用广泛,涵盖诊断、治疗方案建议、文档总结等多场景;
- 法规制定必要性:使用生成式AI存在风险,如信息错误、算法偏见和患者隐私问题,需制定法规确保其安全应用。
九、 工资“白菜价”,但特斯拉仍能吸引10万打工人奔赴的秘密**
- 股票奖励与员工激励:特斯拉提供低基本工资,但通过丰厚的股票奖励