17173 > 游戏资讯 > 科技新闻 > 正文

别了,用了30年的网页!一个前OpenAI研究员用AI把互联网重做了一遍

2026-05-07 17:07:54 神评论
17173 新闻导语

前OpenAI研究员打造颠覆性AI工具Flipbook!上传图片或指令即可生成动态视觉内容,点击任意元素无限探索。体验《新三国》角色解析、二战地图互动、游戏攻略生成,重新定义互联网浏览方式!

小时候你肯定玩过手翻书,快速翻动书页,纸上的小人就会动起来。

bilibili@纸质动画师Millkun

但你绝对想不到,这个童年玩具,现在被一个前OpenAI研究员玩出了花。

网站链接:flipbook.page

这个程序员叫Zain Shah,他做了一个叫Flipbook的网站,彻底颠覆了我们用了30年的互联网。

Zain Shah在X上发布相关演示后,一时间吸引了超55万的人前来围观。

你只需要上传一张图片,或者给它一个指令,它就可以帮你生成相关的信息资料。

比如还原特朗普被刺杀的现场

当然,这和一般的生成式AI没什么两样。它更有意思的功能是,你无论点击图中的什么要素,它都会根据你的选择,继续生成与之相关的内容。

比如笔者上传了一张《新三国》的海报,点击海报中的不同角色就可以生成他们的简介,并且深入了解自己感兴趣的内容,比如点击诸葛亮的隆中对,它就会生成三分天下的局势图

虚构角色也可以生成,比如《咒术回战》

笔者给的指令是,生成一张二战德军的进攻路线,通过点击不同的路线,可以深入对应的战役

Faker的传奇生涯,可以还原大魔王的名场面

文学作品也可以图文并茂,方便记忆

还有知名人物生前健康程度分析

游戏攻略也是一把好手,AI教我玩机宝

它被定义为一个无限视觉浏览器,完全根据需求实时生成。这句话听起来很玄,其实拆开来特别好懂。

从代码到像素

传统的APP和网页,界面都是提前写死的。程序员用HTML写结构,用CSS调颜色、字体、布局,用JavaScript做点击、滑动这些交互。

浏览器把这些代码翻译成我们看到的文字、图片和按钮。按钮在哪,字体多大,导航栏长什么样,都是程序员一行行代码定好的。

但Flipbook完全不一样,界面是AI根据你的需求实时“脑补”出来的。

你看到的每一个“页面”都是一张图片。点击图片中的任何内容,你就会得到一张新图片,更深入地探索那个事物。没有HTML,没有布局引擎,没有代码。整个网络都只是屏幕上生成的像素。

此事在《哈利波特》中亦有记载——《活点地图》

没错!在Flipbook里,文字、按钮、图表、背景……所有东西都是AI实时画出来的。它没有固定的组件,没有固定的布局。

如果它觉得用图表讲数据最清楚,就给你生成图表;如果它觉得用插画讲故事更好,就给你画插画;如果它觉得一段文字最直接,就用最舒服的字体把文字写在图片上。

这种“生成式UI”,打破了几十年来界面设计的所有条条框框。传统上网是这样的:你在搜索框输入问题,得到一堆链接。然后你一个个点进去,在密密麻麻的文字里找答案。Flipbook完全改变了这个模式。

当你输入一个查询,它会先像一个高级搜索引擎一样,在互联网上进行实时搜索,获取最新的文本、图片和数据。然后,它会把这些不同类型的信息输入到多模态AI模型中,融合成一张你能一眼看懂的图。

这不是点链接跳页面,更像是在一个无限大的视觉世界里自由漫游。这就模糊了搜索引擎、浏览器和内容创作工具的边界。它不是在给你展示已有的内容,而是在为你创造专属的内容。

Flipbook还有一个黑科技功能:实时视频流

它能把静态的图片变成连续的视频,页面之间切换完全无缝。

虽然现在这个功能还不太稳定,也特别费算力,但已经能让我们看到未来的样子了。

整合一切:站在巨人的肩膀上

Flipbook是怎么做到的?这么神奇的东西,技术原理是不是特别高深?

其实没你想的那么复杂,Flipbook没有发明什么全新的AI技术,它只是把现有的最好的技术整合在了一起。

Zain将Flipbook的架构比作“用胶带把一堆API和开源模型粘起来的纸牌屋”。

它大量调用各种外部API来获取数据、执行计算。不用什么都自己从头做,专注于核心的生成逻辑。用现成的强大图像生成模型和视频生成模型,大大加快了开发速度。

实时生成高质量图像需要巨大的计算资源,Flipbook用的是Modal赞助的云端高性能计算平台。

这种“胶带与纸牌屋”的架构,虽然听起来有点临时,但在快速迭代的AI时代特别有效。它让一个三人小团队,在短时间内就把一个大胆的愿景变成了现实。

又是一个“小作坊”奇迹

能想出这么疯狂的点子,还能把它做出来的,肯定不是一般人。

Zain Shah曾在三星做过高级创意技术专家,懂设计也懂用户体验,也在Opendoor做过算法,知道怎么处理大规模数据。

Eddie Jiao设计的iOS应用Mosaic获得苹果设计奖

Mosaic将可以任意数量的iOS设备组合成一个大型显示屏

他还是Y Combinator的校友,有丰富的创业经验,懂技术、懂产品、懂设计、懂商业,这样的全才,才能做出这么颠覆性的东西。

Eddie Jiao设计的AI写作助手PenPal

Zain Shah还在South Park Commons做研究,这是一个由顶尖研究人员和工程师组成的新技术社区,在Flipbook的开发上,社区成员也帮了不少忙。

最重要的是,Zain Shah曾是OpenAI的研究员,专门研究机器人。

他当时的工作是“模拟到现实的技能迁移”——也就是让AI在虚拟仿真环境里学会的技能,能用到真实的物理世界中。

这段经历对他影响特别大,他开始思考:互联网其实也是一个虚拟世界,为什么不让AI像理解物理世界一样,直接“生成”这个虚拟世界呢?为什么我们还要用代码这种笨拙的方式,来构建数字世界的一切?

于是他产生了一个关于Flipbook的想法,为此,他组建了自己的开发团队。

Flipbook团队并不是传统意义上的正式公司团队,而是一个由热情的创客和技术极客组成的小型跨界协作小组。说是团队,其实只有三个人,除了他,另外两个人分别是Eddie Jiao和Drew O'Carr。

Drew O'Carr

Eddie Jiao

Drew O'Carr曾是苹果的工程师,参与过苹果生态系统中多个产品的开发,他为Flipbook提供了坚实的技术基础和流畅的用户体验。

而Eddie Jiao曾是Humane的工程师,之后又成为了Slack的工程师,擅长前端开发、用户界面设计和AI应用工程

他在Flipbook项目中主要负责交互系统和用户体验的实现,Flipbook的视觉风格正是他设计的。

据他所说,Flipbook的视觉风格经历了数百次迭代

最早甚至采用过EVA风格的视觉呈现,也就是80年代的CRT风格,以扫描线、球面畸变、低分辨率像素感为核心特征。

也试过50年代的漫画插画风格:

还有意大利设计师马西莫・维涅里的现代主义风格,结合无衬线字体、红黄蓝三原色和黑白中性色。

最终他们选择了等距视角风格,以2.5D等轴的视角呈现三维空间,在Eddie Jiao看来,这种呈现方式在可读性和想象力之间达成了一种完美的平衡。

他们的终极目标:让人和AI更好地沟通

Zain Shah的个人网站上写着:“我通过将界面工作与人工智能工作相结合来做到这一点。我帮助机器理解我们的世界,并帮助我们更好地理解它们。”

这句话就是他做Flipbook的初心。

从“代码构建”到“意图生成”

Flipbook现在还只是一个实验性的原型,但它的意义绝不止于一个新工具,它可能预示着互联网的下一个时代。

自万维网诞生以来,网页的构建模式就没变过:开发者写代码,用户看代码生成的内容。

但这种模式有三个大问题:

开发成本高,做个复杂网站需要很多专业人才;

灵活性差,一旦代码写好,改起来很麻烦;

千篇一律,所有人看到的都是同一个页面。

Flipbook提供了一种全新的模式——“意图生成”。你只要说出你想要什么,AI就会实时生成一个专属的页面。

以后,普通用户不用学编程,也能“创造”出任何自己想要的信息界面。这就像当年印刷术的发明,让普通人也能读书写字一样。

我们现在已经处在一个视觉信息爆炸的时代。短视频、图片社交、直播……越来越多的人不爱看长文字,更喜欢直观的视觉内容。

Flipbook把这个趋势做到了极致,它把整个互联网都变成了一系列连续的、富有表现力的图像。复杂的概念、枯燥的数据、冗长的报告,AI都能变成好看又好懂的图。以后上网不再是“读”网页,而是“看”网页。

当然,现在的Flipbook还有很多问题

首先,AI生成的文字经常会出错,图像细节不够精确,视频流不稳定,而且特别烧token。

鬼知道我盯着这个画面等了多久

其次,图像的呈现方式高度同质化,看个一两张还行,看久了很容易审美疲劳。

不管生成什么,几乎都是一个风格

最后,生成的不确定性,带来了未知的神秘感,但也存在高度的不可控性,每次生成的都不一样,而且不一定是你想要的信息。

乍看感觉有模有样,但细看之下漏洞百出

因此很多网友在使用过后,都对此发表了质疑:

但Zain Shah对未来充满信心。他说,随着模型越来越强,成本越来越低,Flipbook的页面会变得更准确、更具交互性。

它会成为一个统一的数字入口。未来,你不用跳转到不同的APP,在Flipbook里就能完成所有事:查资料、看新闻、订机票、订酒店、购物、支付,甚至办公、开会。

从童年的纸质翻页书,到今天的Flipbook,人类一直有一个朴素的愿望:让画面动起来,让信息更直观。

30年前,HTML的诞生让普通人也能上网。如今,Flipbook的出现,可能让普通人也能创造互联网。

不仅如此,Eddie Jiao还透露:Flipbook的app正在开发中。

你的下一个脑图何必是Xmind,也有可能是Flipbook。 

【来源:公众号】
关于Flipbook,AI生成,互联网,视觉浏览器,生成式UI,实时生成,多模态AI,游戏攻略,交互系统,网页设计的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷