编码人声

编码人声:空间计算、物理计算、实时仿真与创造拥有「自主行为」的小狗 1

编码人声:空间计算、物理计算、实时仿真与创造拥有「自主行为」的小狗

虚拟世界与现实世界的界限逐渐模糊,已然成为不争的事实。但究竟哪些曾经的幻想已然照进现实,又有哪些挑战依然横亘眼前?本期节目,我们邀请三位来自不同领域的嘉宾,从 2024 年底的当下出发,共同审视虚拟与现实融合的真实图景。 InSpaze 的易明分享了在全新的硬件生态 Vision Pro 上开发社交应用的挑战与机遇,并展望了虚拟社交的未来;Motphys 的崔汉青深入剖析了实时物理引擎如何赋予虚拟世界更真实的物理规律,以及在游戏、具身智 …

编码人声:空间计算、物理计算、实时仿真与创造拥有「自主行为」的小狗 查看全文 »

编码人声:能操控电脑的 Computer Use 究竟是什么?万能胶水、旧世界操作员,还是无所不在的智能? 2

编码人声:能操控电脑的 Computer Use 究竟是什么?万能胶水、旧世界操作员,还是无所不在的智能?

无论你是否熟悉 Function Call、Tool Use 或者 RPA,都可能刷到了 Claude 推出「能像人一样操控电脑」的 Computer Use 的新闻。 与 Claude 3.5 Sonnet 一同发布的 Computer Use,可模拟人与计算机的交互,执行如移动光标、点击按钮、输入信息等操作。 本期节目,我们请到了 Riffo 的陈春宇和 LLamaEdge 的 Michael Yuan。Riffo 能在桌面调用 L …

编码人声:能操控电脑的 Computer Use 究竟是什么?万能胶水、旧世界操作员,还是无所不在的智能? 查看全文 »

编码人声:下一代 AI 陪伴,平等关系、长久记忆与情境共享 3

编码人声:下一代 AI 陪伴,平等关系、长久记忆与情境共享

这期对话都来自 AI 陪伴产品开发者最真诚的思考和感悟。 嘉宾们探讨了「真正的 AI 陪伴」应具备的核心元素——平等关系、长久记忆、情境共享和持久对话等。这些元素都指向下一代 AI 陪伴的技术或产品方向。 嘉宾碎瓜曾开发了一款「虚拟恋人」产品,但因不愿看到 AI 成为不平等关系的附属而关闭了它。 另一位嘉宾付则宇花了数月实现了 GPT-4o 的语音对话能力,最后感叹:「复刻 4o 后才发现,这才是语音 AI 的开始。」 理解自己,是理解 …

编码人声:下一代 AI 陪伴,平等关系、长久记忆与情境共享 查看全文 »

编码人声:很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来 4

编码人声:很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来

OpenAI Realtime API 发布了,你准备好了么? Realtime API 让开发者可以构建近乎实时的「语音到语音」的体验,无需将多个模型拼接在一起进行转录、推理和文本到语音的转换,实现更流畅的打断体验,还可以无缝切换多种语言。 本期节目请来了第一批接入并体验 OpenAI Realtime API 的开发者,为你解析背后的技术和开发者的新机会。 两位嘉宾分别是在实时多模态 AI 领域深耕多年的专家——开源实时多模态 AI …

编码人声:很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来 查看全文 »

编码人声:AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远? 6

编码人声:AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远?

随着出货量突破 100 万台的 Ray-Ban Meta 智能眼镜的成功,加上愈加成熟的语音 AI 和视觉理解能力的加持,国内外各大厂和创业公司纷纷进场智能眼镜,「百镜大战」一触即发。 本期节目,嘉宾将从 AR 眼镜从业者、AI Agent 构建者和空间计算开发者的不同视角,分享实践中看到的新机会。 有嘉宾认为,软硬结合的垂类 AR 眼镜解决的是手机无法满足的场景,解决问题就能让用户用钱投票。随着上下游生态链的成熟,现在正是轻型 AR …

编码人声:AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远? 查看全文 »

编码人声:对谈MoonBit,AI时代的编程语言应该是什么样子的? 7

编码人声:对谈MoonBit,AI时代的编程语言应该是什么样子的?

本期节目,我们请到了MoonBit的创始人宏波和资深的开发者狼叔作为我们的嘉宾,一起和大家聊聊关于AI时代的编程语言应该具备的特点和发展方向。 今天,除了讨论尝试利用AI来“帮助”我们写代码之外,我们更希望探讨在AI时代的编程范式是否会发生一些变化。例如,是否会从降低写代码时的输入量,转变为更容易让LLMs理解的结构等方面进行探讨。 本期主播及嘉宾 相关资料 MoonBit 是一个用于云计算和边缘计算的 WebAssembly 端到端的 …

编码人声:对谈MoonBit,AI时代的编程语言应该是什么样子的? 查看全文 »

编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?  8

编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会? 

GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。 同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。 更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。 ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。 投资机构 a16z …

编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?  查看全文 »

编码人声:在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验 9

编码人声:在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验

5 月中旬 GPT-4o 的发布,让人与 AI 的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。 本期节目,我们邀请到实时互动 AI 创业者史业民。他结合了自己的一手研发经验,深度分析了 GPT-4o 在多模态、实时交互、情感语音的新能力和能力边界,分享了 GPT-4o 正在催生的潜在场景和新机会。史业民还从开发者视角,提出了面向开发者的 GPT-4o 和面向用户的 ChatGPT 能力可能存在区别的提醒,以及在开发多模态 …

编码人声:在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验 查看全文 »

编码人声:那些逃离北上广的程序员们,后来都怎么样了? 10

编码人声:那些逃离北上广的程序员们,后来都怎么样了?

近年来,许多开发者朋友纷纷“逃离”了一线城市,选择来到成本更低、生活节奏更舒适的地方,成为独立开发者。那么,这些开发者朋友现在过得如何呢?看似舒服、自在的独立开发生活,又会面临怎样的挑战呢? 本期节目,我们特别邀请到知名的独立开发者周楷雯,和大家分享他的独特经历。从北京到青岛,再从青岛到日本,周楷雯的数字游民之旅充满了收获、孤独和欣喜。他将与我们一起探讨独立开发者的生活,分享他的个人经验和心得体会。 无论你是正在考虑成为独立开发者,还是 …

编码人声:那些逃离北上广的程序员们,后来都怎么样了? 查看全文 »

编码人声:“白嫖”开源的后果就是供应链攻击么? 11

编码人声:“白嫖”开源的后果就是供应链攻击么?

面对网络安全威胁日益严重的今天,软件供应链安全已经成为开发者领域无法避免的焦点。从令人瞠目的Apache Log4j事件,到最新曝出的xz后门事故,我们看到的是一个前所未有的挑战,即使是日常工作中广泛使用的工具,比如xcode,都可能悄然变成攻击者的跳板。 在本期节目中,我们将带您深入探索软件供应链攻击背后的故事,详细解析这些事件背后的技术原理以及潜藏的安全隐患。我们将一同探讨,在当前日益复杂的软件生态系统中,我们该如何强化软件的安全防 …

编码人声:“白嫖”开源的后果就是供应链攻击么? 查看全文 »

Scroll to Top