萝莉 调教
最近这期骗要多火就有多火,全因上线了一项新功能——
上传文献(笔墨、音频、视频),AI不仅能帮衬用笔墨提取要点,还不错通过音频概述(Audio Overview)功能,把文献治愈成AI生成的对话播客,笔据文档实践进行筹谋。
2个AI,用真东谈主般的语音和口气,围绕文献实践情感筹谋,临了回来陈词。
这确切很酷!
而且不是卡帕西一个东谈主在夸。逛了下互联网几大平台,网友们对Notebook LM大齐如故挺买账的。
AI界的KOL@elvis也在卡帕西评述区留言:
卡神称这“让东谈主思起ChatGPT时刻”,完竣不是综合无物!
着实让多种模子集合责任,会解锁Notebook LM这样独有的实践口头和用户体验。
Notebook LM怎样玩?
玩法很浮浅,掀开试玩页面,拖拽上传需要处治的文献。
不错是Google文档,不错是网站和视频相连,甚而干脆粘贴一大段文本齐不错。
每个札记本复旧上传50个文献,每个文献实践上限500000个单词。
这里咱们上传了OpenAI o1的System Card文档,接下来就不错遴荐需要创建的实践。
内置复旧问答、小锤真金不怕火、目次、时刻线、撮要等笔墨版功能,以及两个主抓东谈主的深度对话音频实践。
若是有更个性化的需求也不错我方敲prompt。
咱们尝试用汉文发问,后果AI是不错贯串的。
很可惜的是Notebook LM不复旧用汉文恢复,即使刻意条款也不成。
遴荐创建音频的话,视文档长度需要恭候几分钟到十几分钟。
趁这个时刻来了解一下这背后的Gemini模子叭~
NotebookLM由Gemini 1.5 Pro来复旧,也便是Google家现时旗舰级大模子。
Gemini 1.5 Pro复旧超长128k潦倒文,这是能解读长文档的基础。
在最近的一次升级中,Gemini 1.5 Pro数学和推明智商还反超OpenAI o1预览版。
好了,刚才生成的音频也处治达成萝莉 调教,英语好的一又友不错来听听看。
英语没那么好的一又友,色哥网也不错望望套娃AI转写、翻译出来的AI播客笔墨版,感受一下。
单纯的上传文档,生成实践,还仅仅Notebook的实用玩法之一。
还有东谈主先容了学生上课灌音,回家用AI整理重心的玩法,也广受好评。
(不是我方不听课了的意旨真谛)
具体来说,不错效率以下圭表:、
上课时用手机灌音;
上课技艺不需要用电脑,只需(纸笔)记下苟简的重心;
(下课后)把灌音和札记扫描上传到NotebookLM,让它笔据灌音细节扩写札记。
另外,还不错每周创建一份对所学实践重心的温习音频。
一种与单纯Chat不同的交互范式
其实,NotebookLM并不是出谈即爆火。
早在客岁5月的Google I/O大会上它就还是出现了,不外阿谁时候,当作AI札记本名堂的它还叫Project Tailwind。
到了客岁7月,NotebookLM它才改成现时的名字。
起初,只复旧好意思国局部地区的用户食用;功能也如故围绕着基础的Chat模式伸开。
NotebookLM自动生成文档指南(来自Google官网)
到了这个月11号,NotebookLM霎时晓示面向全球玩家灵通,而况新增了重磅功能,音频概述。
Google给的官方先容是这样的:
“新的音频概述功能,不错一键将文档、幻灯片、图表等滚动为令东谈主沉溺的筹谋。”
因为交互花样很新、AI语音传神、筹谋起来确切很像真东谈主播客,群众一下就玩嗨了。
到这两天,Notebook LM不仅还是巧合把Youtube视频当作输入,还还是复旧超100种言语。
现时,卡帕西的下场“示爱”,更为Notebook LM的热度添了一把火。
如卡帕西所说,Notebook LM爆火最主要的原因,是它提供了一种与单纯Chat不同的交互范式。
卡帕西暗示,Notebook LM摒除了大模子的两大享受足下:
第少量,聊天其实挺难的。
有些东谈主在常常生存中跟东谈主疏通齐用度心力,更别提要和Chatbot聊天,还得不休发问、追问。
NotebookLM好就好在,生成的二AI播客,其中有一方就会处于发问、指引变装。
咱把文档、音视频放进去,恭候生成,好意思好意思听AI笔据文献唠便是了。
第二点,阅读不是件容易的事。
信息爆炸的碎屑化期间,挑个惬意的姿势,或者开车时候听别东谈主筹谋我需要的东西,比我方汉典吧啦搁哪里看容易得多。
——哪怕看的是AI还是帮咱们回来出来的凝练版块(哎,没错,咱便是这样懒!doge)。
本着精雕细镂的精神,也有网友暗示了对Notebook LM更进一竿的期待。
Hyperbolic Labs的联创兼CTO Yuchen Jin试玩事后,回来了两个局限性:
高中生自慰一个是它“看不到”,也便是没法处治文档里的图片信息。
不外背后的Gemini是多模态的嘛,比拟Notebook LM长眼睛不会太晚。
另一个是用户无法指引AI播客的实践。
Yuchen Jin喂给它两条推文,它就生成了近13分钟的音频实践,但它默许听众是粗俗受众,是以讲了好多很基本的宗旨。
若是能指定生成播客的指标群体,或者研究主题、标的、角度,那确切是棒上加棒。
One More Thing
说时迟其时快,成就者搞出开源版的NotebookLM了!
不外暂时只可喂给它PDF嗷。
咱便是说,东谈主类真挑升旨真谛哈!
往日在音频转笔墨方面汉典,追求把播送、会议灌音啥的转成笔墨。
现时又运转用大模子把笔墨转成播客了……
挑升旨真谛哇挑升旨真谛哇(狗头)。
参考相连:
[1]https://notebooklm.google/
[2]https://x.com/karpathy/status/1840112692910272898
[3]https://x.com/omarsar0/status/1840145774874898506
[4]https://x.com/Yuchenj_UW/status/1840203324571943403
[5]https://github.com/gabrielchua/open-notebooklm萝莉 调教