OpenAI多模态团队负责人Alexander Kirillov离职，GPT-4o研发受双重打击

AI世纪 2025-02-07

2025-02-07

刚刚，多模态团队负责人官宣离职。

一位GPT-4o多模态核心离职，一位加入前CTO阵营，对来说简直是双重打击。

GPT-4o多模态关键大佬

在，带领团队致力于多模态模型的研发工作，推动模型不仅能够处理文本，还能同时理解和生成图像、音频等多种数据。

他参与并主导了备受瞩目的「」项目，该项目不仅推出了一个交互式演示系统，还发布了包含11亿个mask的大规模数据集及相关代码。

在，他领导了GPT-4o的训练后多模态工作，负责将GPT-4o的文本、图像、音频和视频处理能力整合到一个统一的模型中，并优化其性能。

论文地址：

GPT-4o是一种自回归全能模型，可以接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像的任意组合作为输出。

它在英语文本和代码方面的性能与GPT-4 Turbo相当，但在非英语语言文本方面有显著改进，同时在API中速度更快，成本降低了50%。

的工作对于GPT-4o实现多模态理解和生成至关重要，使得GPT-4o能够更好地理解和处理多种类型的信息，并以更自然、更直观的方式与用户交互。

SAM一作，多次与何恺明、谢赛宁联手

在Meta任职期间，曾与何恺明、谢赛宁等大佬一起合作了多篇论文。

在爆火论文「分割一切」（）中，他是项目负责人。

构建了一个用于图像分割的基础模型，它包含三个相互关联的组件：可提示的分割任务、分割模型 (SAM) 和数据引擎。

此外，团队还使用数据引擎构建了当时最大的分割数据集SA-1B，其中包含1100万张图像和超过10亿个掩码。

论文地址：

于2023年8月加入。

在此之前，他曾担任 AI研究院（FAIR）的研究科学家，专注于计算机视觉研究。

2018年，他在德国海德堡大学获得计算机科学博士学位，导师是。

他的研究兴趣集中在视觉推理和结构化计算机视觉问题。研究成果多次发表于CVPR、ICCV、NIPS和ICRA等国际顶级学术会议。

2017年，他作为主要成员，赢得了COCO Stuff分割挑战赛。2018年，他在ECCV组织了COCO全景分割挑战赛。

截至目前，总被引数高达4万。

联创火速入职前CTO初创

昨天，联合创始人John 才刚刚官宣离职；今天又被曝出加入了由前首席技术官Mira 创立的 Lab 。

作为一位资深AI研究员，曾带领团队开发了多项创新技术，为的成功做出了重要贡献。

在去年秋季高层出现动荡期间，包括在内的多位高管相继离职。当时也选择加入了竞争对手。

如今，在短短的半年之后，两位老同事再次重聚。

Lab

并不是Mira 唯一的「前同事」。

初创企业 Lab，已经成功从挖来多位重量级研究人员，其中包括：

前后训练负责人 Zoph：致力于对齐、工具使用、评估、、搜索、多模态等等。

前高级研究员Luke Metz：初始团队的一员，参与了的前身「低调的研究预览」产品

前研究员Sam ：专研机器学习和统计物理

据了解，在与潜在投资者沟通时表示，公司的目标是开发能够执行复杂任务的AI系统。

2024年，进行新一轮股权融资时，Mira 突然辞去首席技术官一职。

随后，她迅速开始招募原来的同事，筹备创立自己的AI初创公司，并已完成逾10亿美元融资。

计划将新公司命名为 Lab，可能是向科幻小说《沙丘》里的智能「思考机器」致敬。

特拉华州的注册文件显示， Lab是一家公益公司。

这种架构允许企业在追求利润的同时兼顾社会影响，能在一定程度上防范激进投资者的干预。

这与正在寻求的转型不同，采用公益公司结构的初创企业，如和xAI，在决策时必须声明其公共效益目标，并在股东利润之间寻求平衡。

目前，公司具体的业务方向还未明朗。但根据她对潜在投资者的说法，公司致力于开发AI智能体。

至少有一点是确定的： Lab正在重点从挖人。

GPT

OpenAI多模态团队负责人Alexander Kirillov离职，GPT-4o研发受双重打击

Meta新旗舰AI模型Llama 4 Maverick测试成绩遭质疑

对于游戏科技外溢和AI的冲击，腾讯和网易等公司的技术负责人如何看？

机器之心编辑部以后数据分析的活，也被包了

AI月之暗面创始人杨植麟现身上海创新创业青年论坛

OpenAI惊天内幕曝光！高管怒斥遭打压，7100亿AI巨头内外交困｜钛媒体AGI

AI模型可以用于追踪转移性癌症的源头