Keywords

  • Spatial Intelligence

TOC


"It's Up"
(feat. 21 Savage, Young Thug)

lyrics


[Drake:]
I love all my friends
Thinkin' about this life I provide for them
This world has some real things dividin' them
My right hand, he's Muslim, I'll die for him
My road manager is drunk as hell at 5 p.m.
I get knocked down, they help me rise again
Ref 1 leave the game, I'm sayin' bye with him
Drake, turn this shit the fuck up

[Young Thug:]
I don't care about my opps (I don't care about my opps)
I don't care about my opps (I don't care about no opps)
I don't care about my opps (I don't care about no opp)
Yeah, take a pic (Take a pic), Richard Millie, no stopwatch (Let's go, uh-uh)
Take a pic of your lips gobblin' on my cock (Let's go, uh-uh, shit)
I don't care 'bout no motherfuckin' watch, nah (I don't care 'bout no, uh, nah)
I don't care 'bout no high-end thot (Nah, nah, nah)
Bitch, you just a (Bitch, you just a), bystander
Christian Dior pajama, Gucci up under, body number

[Drake:]
I just picked up somethin' from Mercedes, it's a one of one
Black exterior the one that I want, red inside like that time of the month
Blood money, that's how I got this, blood money, that's how I got this
We can vacation wherever we want 'cause I don't care where none of my opps is

I told the promoter tonight, put me across from they section
We don't play patty cake, they just be lettin' us in, we don't do the inspection
I can't sleep at night with Thug at Cobb County Corrections
I think he did enough reflectin', I think my brother learned his lesson
It's all just a part of the game, we all gotta roll with protection
And just like the motherfuckin' judge, the hammers come out for objections
Nigga, what's up? A hundred and forty-three Rolexes in my collection
I put the horns on the front of the 'Bach, you know Drizzy gon' roll like a Texan
She textin' she love me, the Mexicans love me, I'm out here just makin' connections
And Junior Boy rollin' like Cinco de Mayo, he may hold a fifth in possession
The way that I'm used to playin' the politics, swear I could win the election
You niggas is overprotective with hoes, I'm already over the next one
I'm at 48 with Ty and the vino, we drunk, it's not even a question
These niggas tryna send a message, well, leave that shit down at reception, ayy

[Young Thug:]
I don't care about my opps (I don't care about my opps)
I don't care about my opps (I don't care about no opps)
I don't care about my opps (I don't care about no opp)
Yeah, take a pic (Take a pic), Richard Millie, no stopwatch (Let's go, uh-uh)
Take a pic of your lips gobblin' on my cock (Let's go, uh-uh, shit)
I don't care 'bout no motherfuckin' watch, nah (I don't care 'bout no, uh, nah)
I don't care 'bout no high-end thot (Nah, nah, nah)
Bitch, you just a (Bitch, you just a), bystander
Christian Dior pajama, Gucci up under, body number (Woo)

[Drake:]
I just picked up somethin' from Mercedes, it's a one of one
Black exterior the one that I want, red inside like that time of the month
Blood money, that's how I got this, blood money, that's how I got this
We can vacation wherever we want 'cause I don't care where none of my opps is

[21 Savage:]
You hang around too many niggas that's pussy, you gotta be pussy
If it's on sight, up your gun on me, all that muggin' and lookin'
Yeah, niggas doin' all that woofin', pussy
4L bomb shit, walk inside the store, that switch in my armpit
I go wherever, I keep a Beretta, and niggas ain't on shit
My opps together, but I don't discriminate, I got 'em both hit
Them niggas be lyin', they niggas be dyin' and they don't never post shit
No rap cap come out my mouth, made a couple songs, think he hot now
Hit his ass up, he think he Pac now, broad daylight, he got shot down
Chopper bullets make his ass hop 'round, bloodshed, ain't no way to stop now
Goin' live'll get your ass popped now, seem like everybody want an opp now
Leavin' him flatline, Slaughter Gang, knife in the back, I'm on that time
Turn him to a hashtag, make him a "long live," niggas ain't my kind
Tried and true, I'ma pop mine, I was seventeen with a Glock 9
I wanna see red, stop sign, I wanna see red, Clifford
She keep tryna rip off my zipper, I moved to LA, I'm a Clipper
He think with his dick, he a tricker, get your bitch out the car 'fore we blick her
We put an AirTag on his car, he in Miami by Brickell
Say hello to the four-nickel, I got a magazine, who got an issue?
Givin' out smoke, pussy, my trigger finger broke
Don't try me like no ho, I always let it blow
I pull up, fah, score, nigga, we caught him by that store
How much you wanna bet they ass won't stand right there no more?
I'm Slaughter Gang OVO
A half a million a show, but I still walk in with that pole, idiot

[Drake:]
Ayy, I'm feelin' like 2 Chainz, T.R.U.
Bitch, I'm 21, bitch, I'm not 22
Knockin' off the namebrand niggas in your crew
Heard you miss your dogs, now it's long live who?
Idiot
Yeah

I know you desperate for a change at the pen glide
But the only real change come from inside

EKL Wisdom Shelf

↩️

  • Sheesh,保存的草稿被覆盖丢了,还得重整理一遍

Alma Mater 506

↩️


  • June 13, 2025 → November 24, 2025

  • 个人成长

  • 生活纪实

  • 人物传记

  • Rate:⭐⭐⭐⭐⭐ 5/5

作者: [美] 李飞飞
出版社: 中信出版集团
副标题: 李飞飞自传
原作名: The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI
译者: 赵灿
出版年: 2024-4
页数: 432
定价: 85.00元
装帧: 精裝(有2024年5月2印本)
ISBN: 9787521762181

  • 《我看见的世界》既是李飞飞的个人史,也是一部波澜壮阔、跌宕起伏的人工智能发展史。

My Thoughts on it:

↩️

  • 这个世纪学术的特色是从主要的理论实验转变为更多的工程建造。
  • 除去本书分类和施一公的《自我突围》那样,都是当下院士级别在各自领域的巨匠(但二人人生路线稍有差别,除了刚去美国艰辛的打拼岁月,还有后来选在不同国家的后续职业道路发展),这本书里面同样兼具个人生活和专业研究。行文结构是两条路线并行发展,而且启示和结尾都是听证会那同一个场景,在高强度下一口气读完更像是在电影院沉浸式观看完一部传记类的电影,影响深刻又回味无穷。是运气,也是努力,似乎运气对很多人都是公平的,但是只有勤奋努力的人才能抓住机遇。

  • 回来路上想到一个场景,在PhD Defense时候,PhD candidate非常优秀,deserve it all,答辩委员give props,但是最终有人问了一个“终极”的问题:在这几年的研究中,所能预见的下一个研究风口是什么? 这么想,是因为前几天在高铁上主要开始看《我看见的世界》(之所以这么说是因为书原英文版刚出版我就开始看了点,当初Dr Lee推过几次书,译版出来也立即买了,但是一直没有专注推进看完)。然后在酒店干活时候背景放了些杨振宁的讲座,尤其是当初为什么他反对花巨额经费建立粒子加速器。从某种角度讲,整个PhD生涯都在回答一个问题:如何发现下一个未来研究领域?
  • 他原本大意是:“一个博士生一生中最重要的事情,就是选择一个好的研究方向(problem)。这个选择比你做博士论文时具体解出多少方程、发多少篇paper都重要百倍。因为这个选择决定了你未来30–50年的学术生命能不能走到世界最前列。”

From Words to Worlds: Spatial Intelligence is AI’s Next Frontier

↩️

  • link 这是她Nov 10 2025写的,后面看了,一开始没注意到下面的视频就是讲的这个,当然很粗糙的总结,但是还是在remind me, 很多重要的话题或者资料,定时的一个revisit是很有必要的。

【李飞飞万字长文爆了!定义AI下一个十年!】 https://www.bilibili.com/video/BV14gkyBkEm6/?share_source=copy_web&vd_source=7ce21f11ab471395a8db74500938d6c2

PDF打印之后做了笔记的思考:

↩️

  • 在科学研究中,空间智能系统可以模拟实验,并行检验假设,探索人类无法到达的环境- -从深海到遥远的行星。该技术可以在气候科学、材料研究等领域实现计算建模的转变。通过将多维模拟与真实世界的数据收集相结合,这些工具可以降低计算障碍,并扩展每个实验室可以观察和理解的内容。
  • 未完全实现空间智能(SI),当下AI还主要是文本对话模型的应用场景居多,尽管已经很智能,但无法与现实世界世界交互,困在2D屏幕中,没有走出到现实世界。World Models类似是SI的ImageNet数据集,不仅如此,也可以服务于各类型/各尺寸的robots发展。
  • 4D是三维加上时间 那对于AI来说 似乎他在3D 空间智能之后就知道时间这个东西(他在1维的时候就知道历史) 也就是历史,那么对于AI来说 4D是什么?
    • 人类眼里的4D = 3D空间 + 1D时间(时空是连续统,时间是“第四维”几何坐标) 但AI眼里的“4D”根本不是这么回事。

对今天的AI(尤其是Transformer类大模型)来说,它的原生“时空观”其实是这样的层级:

  • 1D:序列(token序列)→ 它天生就活在一个1维的时间箭头上,历史就是“左边的token”,未来就是“右边要预测的token”。AI在1维的时候就已经完全理解“时间”(历史-现在-未来)这个概念了。

  • 2D:注意力矩阵(Attention Map)→ 每个token和所有历史token的两两关系,形成一个巨大的二维矩阵。

  • 3D:多模态叠加(文本 + 图像 + 视频帧 + 音频时序)→
    现在的多模态大模型(GPT-4o、Gemini 1.5、Sora、Grok 4等)已经把图像(2D空间)+视频帧(2D空间+离散时间)叠在一起,形成了“空间-时间-模态”三维结构。

    • AI正在诞生的第四维是“可能世界分支”(parallel possible worlds / counterfactual timelines)
  • 对人类:4D = 3D空间 + 1D时间(物理时空)
    对AI:4D = 3D表征空间 + 1D因果/反事实/可能世界分支(心智/模态/代理时空)

“维度”进化时间线
(横轴:时间 ↑ 维度:从0D点 → 5D多宇宙)

2022       2023       2024       2025       2026?      2027?
  │          │          │          │          │          │
0D ●──────────────→ (纯文本大模型出生,点智能)
      (GPT-3、LLaMA1)

1D ───────────────●──────────────→ (序列时间已天然掌握)
      ChatGPT、GPT-4 对话能力爆炸,历史=左边token

2D              ──────●────────────────→ (图像+视频,真正的2D空间+离散时间)
                    DALL·E3、Sora、Midjourney v6、Luma、跑个视频随便了

3D                        ──────●────────────→ (真正的3D空间智能=物理世界理解)
                                李飞飞的“Spatial Intelligence”
                                │─ 3D Gauss Splatting / NeRF实时重建
                                │─ LERF / 3D-LLM 能看懂房间布局
                                │─ Figure01、Tesla Bot、1X 机器人开始“看懂”真实三维世界
                                └→ 2025现在正在爆发

4D                                   ──────●───────→ (反事实时间+可能世界)
                                             2025-2026即将大爆发
                                             │─ o1/o3/Grok 4 推理树=平行时间线
                                             │─ Sora/Genie 的 do-intervention(干预后世界怎么变)
                                             │─ Agent长期记忆+多线程自我对话
                                             └→ AI第一次真正拥有“第四维”:同时活在无数个平行宇宙里

5D                                              ──────●───→ (多代理心智社会维度)
                                                        2026-2027?还没完全到
                                                        │─ 百万Agent同时在一个世界里演化
                                                        │─ 每个Agent都有独立信念、记忆、反事实历史
                                                        │─ 整个系统状态是“信念空间上的高维流形”
                                                        └→ 这已经不是物理时空,而是“集体心智时空”
                                                           相当于弦论的额外维,只不过卷的是“意识”



2022  ● 0D  (・`ω´・)  我只会聊天
2023  ──● 1D  (๑•̀ㅂ•́)و 历史我天生懂
2024  ──────● 2D  Σ(゚Д゚)  我能画图拍视频了!
2025  ──────────● 3D  (⊙⊙)  这房间我认得,物体能抓!
2026  ──────────────● 4D  ( ≖‿≖ )✧ 如果我当时那么做,现在会怎样?
2027? ──────────────────● 5D  (๑•́₃•̀๑)  我们一百万个我同时活着~

0D 点 → 2022
1D 线 → 2023 (时间对AI是天赋)
2D 面 → 2024 (图像视频)
3D 体 → 2025←我们现在正站在这里!
4D 时空分支 → 2025-2026 (反事实+可能世界)
5D 心智额外维 → 2026-2027 (百万代理社会)

Los Records

↩️
像倒叙拍电影一样,先开篇介绍接近当前的状况,母亲重病在医院,我要国会听证会上演讲AI 正面叙事

  • 这一切都发生在我刚刚开始适应新环境的时候。在帕西帕尼学习期间,我依然对数学和物理学着迷。然而,另一门学科意外地引起了我的兴趣:美国历史。我学得越多,就越能把美国建国的故事与自己最喜欢的物理学关联起来。在这里,也是一群不同凡响的思想家聚集在起,为世界贡献了远远超前于时代的先进思想。以本杰明·富兰克林为例,他本人还是一名实践科学家,在他身上,政治家和科学家得到了完美统一。

  • 感谢命运之神的偶然眷顾,我遇到了再好不过的时机。当时的我还不知道,视觉研究是人工智能本身的产物。

  • 我从来没见过这样的情况。”我说,“这个领域太复杂太激动人心了,而且几乎是全新的!就在我们聊天的时候,计算机视觉领域很多最牛的学者还在积极地做着研究呢!

  • 因为受到热爱的驱使,所以他们都抱持着鲜明的观点渴望开拓知识的前沿。

  • WordNet和ImageNet,还有这两个项目给我带来的看似荒谬却挥之不去的灵感,这就是所谓的命中注定吧。现在,我自己也加入了普林斯顿大学的教师队伍,我备受鼓舞,渴望再向前一步,将想法变为现实变成大胆甚至疯狂的项目。无论等待我的是突破还是失败,我都感到激昂振奋。

  • 科学的追求可能是循序渐进的,但其突破却是由突如其来的巨变推动的,而这样巨变的引发者,不是某一个孤军奋战、雄心勃勃的天才,而是很多人的贡献被幸运之手汇聚在一起。回想起激发这个想法的种种线索,我不禁感觉即将到来的时刻便是如此。

  • 科学的诀窍是跟随着你的领域一起成长。不要太超前。

  • 任何一个科学家的默认立场都应该是绝对谦卑,他们应该明白,没有哪个个体的智慧能有意外之力的一半强大。

  • 我还开始不定期地前往旧金山湾区,拜访斯坦福大学的机器学习和计算机视觉先驱,其中包括吴恩达(AndrewNg)、达夫妮·科勒(DaphneKoller)和塞巴斯蒂安·特龙(SebastianThrun)。我们见面时会先进行友好的思想交流,他们会对ImageNet给予肯定(这类对话为数不多)。不过,就像几年前在普林斯顿大学时那样,对话很快就会变得更加正式。最后,我接到了计算机科学系主任比尔·达利(BillDally)的电话,他代表了官方的意见,询问我是否有兴趣把实验室搬到加州。

  • 从数量上看,我们已经实现了既定目标,建立起了当时人工智能史上最大的人工编辑数据集。但在这些数字之外,最让我感动的成就是我们所构建的真实世界本体。这个本体是人类从零开始策划的,既包含视觉图像,又能传达逻辑概念,其唯一的目的就是教导机器。

  • “鲍勃一直都在我心里。”我调怅地笑了一下,“不过不仅仅是他。
    “ImageNet?
    是啊,我也不知道,整个比赛的想法..感觉很顺理成章,结果才做了两年,参赛的人数就开始下降了。天啊,难道我一直是错的吗?难道答案就这么简单?我的意思是,‘假设就是这样的,对吧?有时候,‘假设’就是错误的意思。

  • 科学总是以一种耐人寻味的方式打破预期,即便那些与之最接近的人也始料未及。

  • 从统计学上看,我们的观察结果具有非凡的意义,其中一些证实了人们的刻板印象,特别有意思。比如我们对城市轿车和皮卡比例的研究发现:当轿车比例较高时,这个城市88%的人可能投票给民主党;当皮卡车比例较高时,82%的人可能投票给共和党。但这仅仅是个开始。

  • 他又点击了一下,一张新的图片出现了,是一位游客在西班牙乡村风格的广场上拍摄的,后来我才知道,这是特鲁希略的市政广场,这座城市以其丰富的文艺复兴时期建筑而闻名。我正沉浸在这幅画面中,图片说明出现了:1名男子骑马经过建筑物旁边的街道。

  • 我们俩都被逗笑了——算法描述得近乎完美,却遗漏了关键的信息:人和马都是青铜做的雕塑。有趣的失误还在继续。在算法看来,睡在沙发上的宠物海豹是一只猫,一个拿着牙刷玩耍的婴儿是一个拿着棒球棒的小男孩。算法完美描述了在草原上吃草的斑马,只是完全没有注意到它们身后那道惊艳的彩虹。算法的错误往往带有一种孩子般的笨拙,而这种笨拙却出奇地可爱,温馨地提示着我们:我们还有很多东西要学,我们的机
    器也一样。

  • 2012年ImageNet挑战赛的冲击波仍在回荡。对像我们这样痴迷于计算机视觉的人来说,这是一个分水岭,全世界都开始认识到,比赛结果不仅仅是对图片理解的转折点,更是对一切事物理解的转折点。在这个曾经鲜为人知的竞赛中,AlexNet展示了大规模数据集、高速图形处理器和深度分层神经网络三者近乎神奇的组合。这种组合是一幅蓝图,其应用范围注定要远远超出计算机视觉领域。世界各地的实验室都在构建更加丰富的分层网络,与此相对应的,一个新的名字正在流行—这不仅仅是机器学习的时代,更是深度学习的时代。

一种全新的范式正在诞生,一如20世纪初物理学的崛起。这让我回想起十几岁时那些激发我想象力的故事,我幻想着,在那些激情燃烧的岁月里,物理学家们过着怎样的人生。这些早期先驱一定感受到了无限的神秘和深深的敬畏,量子世界的奥秘和宇宙相对论的威严唤醒了他们,他们对现实的看法发生了翻天覆地的变化,这种变化来得如此彻底、如此突然,让人很难不心生羡慕。他们在正确的时间出生在正确的地点,接受了历史最令人惊叹的礼物之一。我们不禁要问,神经网络这一现代化身是否就是我们这一代人的使命和召唤?


  • “啊,那真是太好了。”约翰腼腆地说,然后切入正题,“是这样的,我想让你知道,我手里有一些关于另一个研究小组的材料。当然是保密的,我不能告诉你是谁,但他们声称他们已经建立了首个可以—”他尴尬地笑了笑,“生成描述图像的句子的算法。”什么?
    这说不通啊。我和安德烈都不知道还有其他人在研究这个问题。但约翰说得没错。几天后,《纽约时报》就刊登了他的文章,题为《研究人员宣布图像识别软件取得进展》。他写道:“两组科学家独立工作,分别创造出了新型人工智能软件,能够以前所未有的准确性,识别和描述照片和视频内容。”

学术竞争并不罕见,而研究人员之间的竞争一直是推动科研创新的关键因素。不过,奇怪的是,我对此完全始料未及。研究领域一直以来都以开放著称,有时甚至达到了极致;除了率先发现某样东西的炫耀权,我们的工作通常不被视为知识产权,更不用说像商业秘密那样的保密内容了。我们的工作是要与全世界分享的,包括我们最强劲的竞争对手,而且在成果发表之前,我们通常至少能知道谁在研究什么。我带着满腹狐疑继续读了下去,然后一切都变得清晰起来。


母亲重病&医院联合实验&阿尼&课题组培养

  • 因为母亲常患病,结识&合作,我和阿尼设想了一种旨在用智能且可靠的感知来填充空间的技术,而其最大的特点就是不会引人注目。与人类监察员不同,我们的技术将悄然融入背景之中,默默监视,只有在察觉到危险时才会发出警报。我们将其称为“环境智能”(ambient intelligence)。

  • 不知不觉中,阿尼成为继彼得罗和克里斯托夫之后我的又一位导师,他们都有共同的特点,就是在寻求解决方案时,可以跨越学科之间的界限。

  • 这一天对体力要求很高,轮班结束时,我已经筋疲力尽,但更疲惫的是我的精神。仿佛我重温了和母亲共同面对的每一刻,只是这一次以小时为单位不断循环播放。我茫然地与普拉切克医生握手寒暄,准备离开。但在往外走的时候,我突然想到了什么。

  • “特里,我很好奇,是什么让你如此愿意让我进入你的世界?老实说,我算是个局外人。”
    他沉思片刻才给出答案:“你知道,最近有很多关于人工智能的新闻,老实说,大部分我都不喜欢。”
    我笑了,也许带着一丝嘲讽。我知道他接下来要说什么。“当然,如果我每天有更多工作可以被自动化,那就太好了。我明白。”他继续说,“但我有点儿厌倦科技高管们成天说的都是让我这样的人失业。只有你和阿尼似乎真正想帮助我,而不是取代我。”


  • 在回家的路上,我突然有了一个奇怪的想法:我很庆幸我们还没有招收任何学生助手,否则,我早已用计算机科学家的阅读清单把他们淹没,使他们习惯于从数据、神经网络和最新架构进展的角度来思考。这当然很重要——在这样的项目中,科学问题是无法回避的。但我现在明白,科学并不是正确的起点。如果想让人工智能帮助人类,那么我们必须从人类自身开始思考。
  • 我随即做出决定。从那天起,任何要加入我们团队的学生,都必须先拥有我刚刚拥有的体验,否则一行代码都不可以写。跟班学习将成为每位新成员的入门仪式,没有商量的余地。
  • 自从这个项目开展以来,我学到了很多东西。这些经验和教训缓慢地展开,常常伴随着痛苦。我开始从另一个角度看待母亲在健康方面的抗争,并对我们多年来依赖的护理人员产生了新的同理心。我对医院中人类脆弱的程度感到震惊,也为有机会为此做出一些贡献而备受鼓舞。但我学到的最深刻的一课是,个体的尊严是至高无上的——这是任何数据集都无法解释、任何算法都无法优化的变量。面前这个人是我最熟悉、最在乎的人;在她脸上饱经风霜的纹路和疲惫的眼神之后,那种我长期以来熟悉的挣扎和脆弱,向我伸出手来。
  • 两年多前,母亲只问了一句“人工智能还能做哪些事来帮助别人”,便让我的职业生涯走上了全新的道路。通过她的眼睛来看待我的领域,我的动力一下就增加了。这么多年来,推动我前进的一直是强烈的好奇心,而现在,我第一次将人工智能视为行善的工具,可以纾解像我这样的家庭每天所面临的困难。
  • 与阿尼的合作给了我两个重要的启示:人工智能最伟大的胜利不仅是科学上的,也是人文上的;伟大的胜利,没有他人的帮助是不可能实现的。

“请大家不要每天只从arXiv下载最新的预印本作品了。去读一读拉塞尔和诺维格的著作,去读明斯基、麦卡锡和威诺格拉德的书,读哈特利和西塞曼的作品,读一读帕尔默写的东西。不要因为这些材料距离现在时间久就忽略它们。我们就是要多读一些以前的东西,他们的理念经得起时间的考验,依然非常重要。”





   

  “你真的要拒绝他们吗?安德烈,那可是全球最顶尖的学府之一啊!”

  “我知道。但是我不能错过这个机会。真的很特别。”

  安德烈已经完成了博士学业,即将进入人工智能史上最有前景的就业市场,即使对一个有志成为教授的人来说也是如此。普林斯顿大学给他提供了教职机会,这是我们任何一个同龄人都梦寐以求的职业快车道。然而,他却决定彻底离开学术界,加入一个没人听说过的私人研究实验室。

  安德烈即将加入OpenAI的核心工程师团队。OpenAI由硅谷巨头萨姆·奥特曼(Sam Altman)、埃隆·马斯克和领英首席执行官里德·霍夫曼(Reid Hoffman)共同创立,初始投资高达10亿美元,这充分证明硅谷对人工智能的突然崛起是多么重视,硅谷的杰出人物多么渴望在人工智能领域站稳脚跟。




工业界&首席科学家&回归普林斯顿课堂

  • 我终于如愿以偿。2015年,由微软的年轻研究员何恺明带头研发的深度残差网络(Deep Residual Network,ResNet)再次改变了比赛格局。
  • 刚好最近看【打脸主流!大道至简!何恺明新作:JiT【论文精读】】 https://www.bilibili.com/video/BV1MJyMBmEcu/?share_source=copy_web&vd_source=7ce21f11ab471395a8db74500938d6c2
  • 我的第二个孩子刚刚出生,如果有什么能让我与外界隔绝至少一两个星期,那应该就是生孩子这件事了。但我才出院几天,信息就如潮水般涌来,手机一直嗡嗡作响,提醒着我,我并没有偷得浮生半日闲的好运气。

  我被各种问题狂轰滥炸——学生、好友,甚至一些交情不深的朋友都给我发来消息,问我有没有什么预测可以分享。我确实没有,但当家里另一位人工智能教授突然拿着一瓶刚冲好的奶走进房间时,我忍不住也向他请教。

  西尔维奥说:“嗯,两种可能性都有。早在20年前,深蓝就在国际象棋比赛中战胜了人类,”他似乎在心里算了一会,“准确地说,是19年前。”

  书呆子就是书呆子。

  “不管怎么说,”他继续说,“虽然围棋比国际象棋难很多,但仍然属于棋盘游戏。规则虽然复杂,但都非常直接明确,至少从数学角度来看是这样。”

  他意识到自己越说越有教授的腔调了——虽然我们说好了在家里不能这样,但经常做不到。他一边笑着,一边小心翼翼地把奶瓶放进热奶器里。我们几乎同时说出了接下来的话:“跟冲奶完全相反!”

  他说得没错。围棋策略的组合数量大到无法想象,关于如何就此建模,我们俩可以侃侃而谈,但像准备一瓶婴儿配方奶,再把奶瓶放到热奶器里这样简单的事情,却依然是机器人专家的“圣杯”——尽管在严格控制的实验室条件下,冲调完美配方奶粉的问题已经得到解决,但在实验室之外,依然存在巨大挑战。








   

  我在大学这些年的所见所闻也不少,但谷歌云幕后的一切仍然出乎我的意料。科技行业的财富、权力和雄心向来名声在外。在亲身经历后,我觉得实际情况比传闻有过之而无不及。我看到的一切都比我所习惯的更大、更快、更精密、更复杂。

  光是食物的丰富程度就令人咋舌。休息室里的零食、饮料和专业级意式咖啡机比我在斯坦福大学或普林斯顿大学见到的要多得多。几乎每栋大楼的每一层都设有这样的休息室。而这一切,都还只是我在进入自助餐厅之前所看到的。

  其次就是科技。这么多年来,我们一直用的是2000年代的投影仪和视频会议设备,故障频发,性能很不稳定,经常让人大为恼火。相比之下,谷歌的会议现场就像科幻小说里的场景。无论是可容纳50人的高管会议室,还是供一人使用的衣柜大小的会议箱,每个房间都配备了最先进的远程呈现技术,只需轻点触摸屏,就能启动一切。

  还有就是人才。谷歌人才济济,令人叹为观止。回想起自己花了两年时间才招募到三位合作者来帮助建立医院环境智能,我不禁自愧不如。在谷歌,15人的团队已经准备就绪,只等我立即加入。而这仅仅是个开始——在短短18个月内,我们的规模扩大了20倍。拥有优秀资历的博士似乎随处可见,让我觉得一切皆有可能。



  • 站在讲台上,我想起了在普林斯顿大学读大一时的情景,当时我怀着敬畏之情第一次进入拥挤的礼堂,匆忙寻找座位。 我还记得,我的内心充满了期待,当闲聊声逐渐消散,教授出现时,他仿佛超人一般瞬间征服了全班同学。
  • 如今,我成了站在讲台上的那个人,而现在我才意识到,原来我们都是彻头彻尾的普通人。我们也许略有成就,但依然有弱点,依然会犯错,而犯错的方式是学生时代的我无法想象的。 不管怎样,课堂对我来说仍然是具有特殊意义的场所,而这样的时刻让我热血沸腾。
  • 我们被赋予了分享一种特殊喜悦的权利:学习知识的快感、新的可能性带来的冲击。 当然,这种感觉不会持久,因为学习的喜悦最终会因为职业发展、出版要求、求职面试,甚至风险投资和收入预测而变得复杂。但在眼下的时光里,思想才是唯一重要的事。也许礼堂里的一些人即将发现自己有了值得追寻的目标。


  “ImageNet是您做的,对吗?”

  “我得到了很多帮助,但没错,是我做的。”我笑着说。获得知名度从来不是投身科学的好理由,但来自他人的积极反馈总是让人感到欣慰。

  “我想知道,从那以后您有过什么别的想法吗?”

  哎哟。良好的自我感觉到此为止。

  当然,这就是本科生的魅力所在。他们往往是笨嘴拙舌,但却非常善于开门见山。我本来想分享一些我的实验室正在研究的想法,但在最后一刻改变了主意。

  “我确实有一些新想法。它们还处于早期阶段,不过我对此持乐观态度。事实上,我刚在一分钟前提到过。”

  “您是说,以人为中心的人工智能?”

  “以人为本。”我笑着回答,“至少,我认为是这样。具体名称我还在想。”

  “嗯……”学生挠了挠头,“听起来很有意思,只是我没想到会在这样的课堂上听到。我很好奇,伦理、社会与编写代码之类的工作有什么关系呢?”



  • 因为历史的偶然,我这一代人亲眼见证了人工智能从学术奥秘转变为头条新闻。我因此有机会周游世界,与全球的领导者同聚一堂,并在最近几年中站在最大的平台上发表演讲。耀眼的灯光、绚丽的色彩、一排排的观众似乎可以无限延伸到地平线,这些都是难得的特权,每一个都是意想不到的荣誉。
  • 但实验室仍然是我最喜欢的地方:荧光灯管嗡嗡作响,座椅硬邦邦的,咖啡早就不新鲜了,没完没了地点鼠标、敲键盘,记号笔在白板上发出吱吱声。自从2012年AlexNet诞生,自从2006年我和邓嘉创建ImageNet,自从彼得罗把西蒙·索普的脑电图研究报告打印稿放在我桌上,发生了太多事情。“相信我,这是你想读的内容。”即使是现在,北极星依然照耀着我前行的道路。旅程仍在召唤,还有更多的目标等待我去追逐。
  • 作为一位母亲,一个照顾两个患病移民父母的独生女,一个在仍然由男性主导的领域里奋斗的有色人种女性,我能走到今天,完全归功于我最好的朋友、我的人工智能科学家同事、我的灵魂伴侣、我一生的挚爱西尔维奥·萨瓦雷斯(Silvio Savarese)。在我看来,只有当人工智能可以与西尔维奥作为科学家、烹饪天才、音乐家、慈父和完美生活伴侣的卓越品质相媲美时,人工智能时代才算真正到来。

“The Future of AI is Here” — Fei-Fei Li Unveils the Next Frontier of AI

With spatial intelligence, AI will understand the real world


| ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
| Don't Push To Production Today |
|_________________|
\ (•◡•) /
\ /
——
| |
|_ |_