作为全球科技领域一年一度的“盛会”,ces2026将于1月6日至9日在美国拉斯维加斯盛大举行。海信空调将携多款创新产品高调登场,集中呈现人工智能在空气环境管理方面的最新突破与实践成果。其中,斩获德国红点概念设计大奖的海信空调智慧风pro系列新品airmaster,将首次亮相ces国际舞台。据了解,该产品与近期在国内首发的海信大力神空调同属2026美加墨世界杯定制机型,延续海信空调“全球协同、本地深耕”的研发理念,专为全球球迷打造兼具沉浸感与健康属性的“满分世界杯观赛空调”。...
离职的杨立昆(lecun),转身便向 meta 抛出一记重击:饱受诟病的 llama 4,确实存在“刷榜”操作!
结果的确被轻微调整过。 为追求更优指标,团队在不同基准测试中切换使用了多个模型版本。
常言道:莫招惹离职人。不只杨立昆,田渊栋也在其个人年度复盘中悄然揭开一角内情。
明明是被临时抽调来为 Llama 4 紧急救场的,出发前我预设了四种可能路径,结果扎克伯格直接甩给我第五种……
(扶额苦笑.jpg)
Anyway,关于离职后的动向,两位业界泰...
deepseek团队近期发布了一篇题为《mhc: manifold-constrained hyper-connections》(《mhc:流形约束超连接》)的论文,正式推出全新网络架构——mhc(流形约束超连接)。该设计聚焦于缓解大规模模型训练过程中普遍存在的不稳定性难题,有望为未来基础模型架构的升级提供关键思路。
论文作者名单中,DeepSeek创始人兼CEO梁文锋位列联合作者,核心研发工作由解振达(Zhenda Xie)、韦毅轩(Yixuan Wei)与曹焕琪(H...
在最新公布的 semianalysis inferencemax 基准评测中,signal65 对 deepseek-r1 0528 混合专家(moe)模型的推理能力进行了深度评估。结果显示,英伟达(nvidia)gb200 nvl72 机架级系统在同等规模下,推理性能显著超越 amd instinct mi355x 集群。
混合专家架构的核心优势在于按需调用最适配任务的“专家”子模型,从而提升计算效率;但当模型规模持续扩大时,节点间通信延迟与带宽压力随之加剧,极易演变...
晚点独家获悉,1 月 8 日智谱上市当天,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,宣布很快将推出新一代模型 GLM-5。
唐杰说,今天是 “智谱生命中激动人心的一天”。他没有直接回应大模型公司的商业模式争议或给出智谱 2026 年商业化目标,但强调,真正 “有人用”,能帮到更多的人的理论、技术或产品才是智谱在追逐 AGI 路上的重要成就。
除了 GLM-5 的发布,内部信还介绍了 2026 年智谱聚焦的三个技术方向,包括全新的模型架构设计,...