对话Speak创始成员:从 960万美元 ARR 到 OpenAI 2700万美元投资;Speak 的产品思考与 PMF 探索!
Speak 是一款创新的AI英语口语学习App,由Connor Zwick和Andrew Hsu 作为联合创始人,以及Sean Chao作为创始成员之一和现任产品负责人。
Speak 旨在帮助用户提高口语能力,并提供与真实家教对话的体验。他们认为,虽然英语学习涉及到许多方面,如语法、词汇、写作和SAT备考,但口语能力是最关键的。因此,他们致力于提供一个真实、流利的口语对话体验,帮助用户在这一方面取得突破。
在基于AI的消费者产品领域取得了巨大的成功, Speak 通过高效的本土化营销活动在韩国赢得了良好的口碑,去年实现了惊人的960万美元的收入,同时在AppStore 教育类别中获得了最高的评价;在去年的B轮融资中, Speak 拿到了来自 OpenAI 2700 万美元的投资。
Andrew Hsu(左),Connor Zwick(右)
目前, Speak 已经成为韩国最受欢迎的教育应用程序之一,并扩展到全球,团队在旧金山、首尔和欧洲设有办公室,拥有30多名员工,致力于开发最优质的学习体验。
在高中时期,Connor Zwick 通过开发一款名为 Flashcard Plus 的学习辅助应用程序取得了成功,而 Andrew Hsu 也很早就对教育产生了浓厚的兴趣,因为他本人是一位跳级学生,并接受了家庭教育,他的天才故事甚至受到了NBC新闻的报道,在16岁时 Andrew 就已经获得了华盛顿大学的三个学位,并正在斯坦福攻读博士学位。
在 Connor Zwick 和 Andrew Hsu 看来,语言学习一直是一个未解决的问题。除非你移居英语母语地区,否则要学好英语几乎是不可能的,而机器学习的发展给语言学习带来了新的希望, Speak 构建了一个完整的语音识别系统,不仅能理解人们说的话,还能理解他们的口音,这使得使用 Speak 比找家教更为优越。
在过去的两个月里,Speak 在产品中融入了 GPT-4 来支持其部分 AI Tutor 功能,该功能允许学习者参与开放式对话,并获得关于他们的语言技能在词汇、语法等方面的母语程度的反馈。Zwick 表示 GPT-4 能够生成具有更高准确性和连贯性的文本,从而为学习者提供更自然、更有指导意义的交互,而在 3 月份,Speak就宣布其 ChatGPT 插件的 alpha 版,从而让 ChatGPT 用户能够直接通过 OpenAI 更无缝地访问 Speak 的产品。
回到产品层面, 这期内容除了介绍 Speak 创业的早期故事,还将揭示为何 Speak 持续押注韩国这个单一市场?两位创始人是如何进行产品思考的?以及 Speak 是如何达到 PMF 并达到 960万美元的ARR,总结 5 个部分:
从激情开始,收敛创业的想法
一次次的重复,MVP的打造
喜爱的产品,从单一市场切入
产品思考,PMF的连续性
内生性,创造价值的三要素
enjoy👻~
从激情开始,收敛创业的想法
Connor Zwick
我在高中时创办了我的第一个公司,叫做Flashcard Plus。我一直对计算机非常感兴趣。我买了第一部iPhone,我意识到iPhone的大小和我为考试学习和记忆而使用的索引卡差不多大。所以我开发了一个手机应用程序来解决自己的问题,结果它变得非常受欢迎。
Sean Chao
我们曾经住在一个宿舍里,三个卧室,五个人,Connor是其中之一,我的第一个印象是,他是一个很高的人,大约有6英尺3英寸。那是我最初的印象。因为他在上学之前就有这个产品和生意,所以他总是很忙,但有时我们会一起闲聊,讨论一些随机的事情,然后他会告诉我们他马上要接一个电话,所以他会去自己的房间。有时他会飞到旧金山。
他似乎对于了解社会运作方式以及整个硅谷的情况比我们都要领先一步。Connor会告诉我们上一次会议发生了什么事,硅谷目前正在发生什么样的交易。我们都会倾听,因为虽然我们都是大学生,但我们没有这种透视事物的经验。而Connor就像是通向那个世界的窗口。
Connor Zwick
我认为在年轻的时候,以年轻的年龄卖出Flashcard Plus的经历对我影响最大的是,它使我不必担心或优化赚钱的问题,而是让我有了自由,我可以专注于从激情的角度思考我想追求的东西。这最终导致我休息一年,什么都不做,只是专注于与我的合作伙伴进行 AI 研究。
Andrew Hsu
我有一条非常不寻常的教育经历。我在四年级的时候在公立学校,但我很快就完成了整个课程,并开始惹恼其他孩子,在班级里引起麻烦。我的父母有一天发现了这个问题。他们决定让我接受家庭教育,因为显然公立学校的教育体系不适合我。这种方式让我的成长非常迅速,我以非常快的速度通过了中学和高中的课程。
我12岁的时候,我实际上已经完成了所有的课程。所以下一步就是大学。所以我实际上在12岁的时候去了华盛顿大学。这显然是一种非常不寻常的情况。我在大学度过了四年时间,学习了生物化学和神经生物学,并在之后去斯坦福攻读了神经科学的博士学位。我完成了三年半的博士学位课程,然后决定退学追求。
一次次的重复,MVP的打造
Connor Zwick
我实际上是通过Tail Fellowship认识了我的合作伙伴,而且在我们开始一起创业之前,我们几年都是室友。我们当时并不知道自己想要做什么,我们只是对 AI 感兴趣。
Andrew Hsu
我们意识到的第一步是花一年时间深入研究机器学习。我们都在阅读各种资料,非常清楚机器学习将改变一切。我们实际上花了整整一年的时间学习、研究、上课,真正深入机器学习。
Connor Zwick
我们构建了很多不同的算法来解决各种问题。我们对语音识别特别感兴趣,构建了一个完整的语音识别系统,不仅能理解人们说的话,还能理解他们说话时的口音,这样做获得了最先进的结果。
让我们感到非常惊讶的是,我们只是使用YouTube上的随机数据,而且这些数据甚至没有标记得很好,我们却创造出了非常准确的结果。
实际上,你可以将 Speak 的故事简化为一系列的假设,即降低风险的尝试。最初,我们关注的是我们是否能够构建一个人们真正使用的语言学习体验,是否能够从中收集足够的数据,以供我们的算法使用,并创建一个数据的良性循环,以改善建模、产品体验,并获取更多的数据?
这也是我们种子轮融资的基础,它基本上只是一个技术上的概念验证;当我们开始时,我们对语言学习一无所知;实际上,我们只是开始尝试构建概念,并尽可能多地学习,尽可能多地让用户尝试,并进行测试,不可避免地发现效果不够好,然后我们就会吸取教训,回到起点,一次又一次地重复这个过程。
喜爱的产品,从单一市场切入
Andrew Hsu
Speak 的最初几年为了找到 PMF 相对艰难,当时尝试了很多不同的产品体验,推出了新的东西,但似乎没有什么效果。我们在全球范围内推出了产品,在每个市场都有短对话的功能,当你刚打开它时,你可以选择一个类别,然后选择你想要谈论的话题,然后进行一个简短的对话。
Connor Zwick
有很多次我们发布了一些东西,人们说他们喜欢,但没有人真正喜欢,用户在30天内都会流失,他们不会长时间使用,这是一个非常令人筋疲力尽的过程,很难保持动力。
我认为在你真正拥有受人喜爱的产品之前,这个时期可能是你需要最具韧性的时期,但我们一直对此保持着极大的执着,可能有两三次我们觉得我们可能有了一些突破,人们开始使用它。
我们与投资者交谈,他们说你应该扩大规模,但我们是抵制这种心态的,这不是一个能够构建领先产品类别的体验。我们想要全球推出产品,但很快意识到,如果想要构建一个人们喜爱的产品,需要选择一个单一的市场,并从那里开始。
我们实际上飞往了很多不同的国家,去了韩国以及日本,还考察了欧洲,与这些市场的许多用户进行了交流。
Sean Chao
我在韩国出生长大,直到五年级。即使在Connor离开之后,我们保持联系。在我在纽约工作的第二年,他突然打电话给我。他问我,SJ,我有一个疯狂的想法。我需要去这些国家做韩国的用户测试,我希望你能陪我去一周,你可以充当翻译兼计划人员。当时我还有很多假期,所以我说好,哇,这似乎是一个免费去韩国的机会。所以我答应了。然后我立刻参与了帮助他招募用户测试者的工作。
Andrew Hsu
所以大家都在一个小房间里,我们都坐在一个中央的桌子周围。用户进来后,我们会给他们一部测试手机,让他们使用。然后我们在旁边的三脚架上放置了一部手机,用来录制整个过程,这样我们就可以看到屏幕上的情况以及他们的使用方式。问题是,韩国的很多用户能够理解我说的英语,至少50、60、70%。但他们在回答时很困难。
Connor Zwick
在韩国,人们有很多意见,并尝试过很多选择。即使只是在首尔四处走动,你也会看到那些专门用于英语课程的巨大摩天大楼。一个相当疯狂的统计数据是,曾经有一段时间,韩国将其国内生产总值的1%用于学习英语。韩国人每个人花在学习英语上的钱可能是其他可比市场的两三倍,这是一个非常活跃的市场。如果你能让产品在韩国成功,那么你就能让它在任何地方成功。
Speak产品思考,PMF的连续性
Sean Chao
在产品初期,答案非常清晰。用户经常告诉我们,他们想要多说。说得不够多。我们开发了这个产品,我们致力于优化口语体验。我们将它推出到应用商店,我记得有三个人付费。第一天我们赚了18美元,我们庆祝了一下,那是2018年1月。
Connor Zwick
我认为人们不喜欢一个产品有很多原因。当你构建一个消费者产品时,消费者比B2B产品更加挑剔。问题不在于构建一个糟糕的体验,而是因为人们的注意力有限,他们有很多选择来度过他们的空闲时间。
所以你要与Instagram、YouTube竞争,或者选择散步、去健身房。人们可以做很多其他的事情。构建一个好的体验不仅仅是构建一个足够好的体验,而是构建一个在当时足够好以胜过所有其他选择的体验。这真的很困难。
我们意识到人们不使用我们的产品的一个重要原因是,我们的产品要求用户将其手机放在嘴边说话。而用户想要使用我们的产品的时间是在地铁或公交车上,通勤的时候。韩国人每天在公交车和火车上花费很多时间。这实际上是他们可以养成习惯的关键时间段。
那是人们最多使用手机的时间。我们有一个与预期相反的认识,通过在这种环境中使用我们的应用程序,实际上可以帮助他们养成习惯,以便他们可以在其他情况下继续使用产品,从而实际上实现我们预期的口语使用。这是我们在去韩国之前没有任何见解的事情。
我们一直问人们为什么不使用我们的产品?发生了什么?然后我们就观察韩国的人们,当我们这样做时,我们看到了使用量的飙升。转化率提高了,留存率显著提高。
我认为 PMF 是一个不仅仅是单一点的事物,而是一个连续的过程。你改进 PMF 的程度越大,你的增长速度通常就越快。我们首次实现 PMF 是当我们开始看到人们真正使用 Speak 并保持使用的时候。那时我们开始真正地增长。那是几年前的事了。自那时以来,我们一直在努力尽快地推出大量新的产品功能和内容。
Andrew Hsu
Speak 首次达到某种程度的 PMF 时,我不能说它是完全的 PMF 。我认为即使到今天,我们也没有完全实现这一点。老实说,这是你一直在努力改进的东西。但我认为我们确实感到,嘿,我们有了真正的东西,人们愿意为之付费,我们可以提高收费标准。这感觉太棒了。我们终于找到了在市场上起作用的某种公式。与此同时,这也是非常有动力的,嘿,既然我们已经有了一个有效的起点,那么现在让我们努力工作,使它变得更好。
内生性,创造价值的三要素
Connor Zwick
我认为创建一个真正有价值的服务有三个主要组成部分。首先是机器学习的能力,这是非常困难的,但它驱动整个体验。我们不断训练和构建新模型,以提供新功能。
Andrew Hsu
Speak 成立的头几年,我们无法在机器学习方面投入太多的精力和资源。我们更专注于找到 PMF ,构建应用程序,并尝试各种新事物来实现 PMF 。当我们刚开始 Speak 时,我们没有数据,这是一个经典的先有鸡还是先有蛋的问题,要建立模型,你需要数据,但要获得数据,要么成本高昂,需要全程手动操作,要么就需要创建一款可以收集该类数据的产品,但前提是你的模型足够好。
实际上,让我们能够解决这个问题的是,2015年,现成的语音识别在某些特定情况下已经足够好,可以提供可接受的产品体验。这使我们能够推出 Speak 的第一个版本,而无需训练和定制模型,它的表现足够好,以至于越来越多的人开始使用它,而当他们在应用程序中说话时,我们可以使用那些训练数据来微调机器学习模型,语音识别模型,并改进其性能,启动整个循环。
直到最近一年,我们才拥有了一个机器学习团队,他们正在开展各种非常令人兴奋的工作,这些工作将在未来一年左右为产品提供动力,包括对话功能。我们正在思考的是,最先进的机器学习模型如何解锁产品方面的功能?对于语言学习来说,有哪些神奇的新体验?
Connor Zwick
第二个关键是尽可能快地发布尽可能多的新产品功能,以构建最吸引人、最有用的产品。第三个非常重要的部分是构建人们喜爱的内容。显然,我们可能比其他英语学习者更像是一家技术公司。
很明显,我们可能有一个更好的产品。但是,内容是另一个非常重要的方面,在英语公司中,他们通常只投资一次来构建一个内容库,然后之后所有的时间和资金都花在营销上。
但我们相信我们可以不断提高内容的质量,使其变得更好。我们对我们的内容采取非常产品导向的思维方式。因此,我们进行A/B测试,不断进行迭代和修正。
我认为第二个重要的组成部分是营销。显然,你需要拥有一个出色的产品,才能够有效地进行营销。要摆脱韩国所有的营销噪音,让人们了解 Speak 并愿意尝试它是非常困难的。因为我们在韩国有一个真正世界级的本地营销团队,他们在尝试各种不同的选择上非常有创造力和原创性。他们已经成功为我们创建了一个独特的品牌形象。
Sean Chao
在营销早期,我们尝试了几种不同的文案和媒介形式来吸引用户下载应用程序。我们最初真正喜欢的是AI的角度。我们当时想,哦,AI导师,使用AI学习说话。但我们很快意识到,受众对AI的概念有着非常不同的理解。他们期望的是与我们提供的有所不同。
所以对我们来说,我们是在使用AI技术进行语音识别,但人们认为我们会提供类似机器人、自由对话等其他内容。因此,因为期望与我们提供的内容不符,我不认为那个方案很好。而真正奏效的是在第一次尝试中,聚焦于 Speak ,你可以说话。真正关注说话的概念。
就是通过说话学习英语。在我们的前几个练习中,我们会让用户在20分钟内说80到120句话。我们当时想,好的,让我们在这方面设定一些指标。比如说,20分钟内说100句话的口号。然后我认为那真的引起了人们的关注。
Connor Zwick
有一个指标我特别喜欢看,也是我们非常自豪的,就是我们有50%以上的订阅用户在开始订阅后的第30天仍然活跃。
事实上,我们一直如此专注于韩国,现在看来有点疯狂,但我认为保持对
一个市场的超级专注对我们的成功至关重要。但是现在,我们觉得我们终于准备好真正地扩展到其他地方了。我们觉得我们已经证明了这个模式,现在我们需要扩展。所以我们将在几个月后进入日本市场,也将在几个月后进入美国市场。
我们正在采取与我们在韩国采取的完全相同的方法。我们优先考虑立即建立本地团队,他们可以找到为日本定制产品的方法。我个人将去那里与用户交流。我们已经在那里与许多用户进行了测试。我们可以将我们在最初在韩国学到的如何进入新市场的教训应用于日本以及其他任何市场。我们的。
Andrew Hsu
最终的使命是解决语言学习的问题。我们认为语言学习目前是一个尚未解决的问题。除非你搬到美国,否则想要学会说英语几乎是不可能的。至少需要20年的时间。
Sean Chao
语言学习,尤其是口语学习,一直以来都是有能力支付另一个人时间的人的特权。你需要预约时间,与母语人士进行对话,才能进行口语练习。所以它非常有限。会说英语的能力对于很多人来说真的打开了很多门。例如,如果你是巴西的一名优秀的开发人员,你是否能够以专业水平说英语是很重要的。
你可以在本地工作,但如果你能说英语,你可以在世界上的任何公司工作。这真的为你打开了很多机会之门。对于我们在这里的 Speak 团队来说,我们真的希望平等化竞争环境。
语言学习,尤其是口语学习,一直是那些有钱支付的人的特权。但我们希望使其对全世界的人们更加可接触,无论是英语还是其他语言,为许多人打开机会之门。
Andrew Hsu
我们相信我们正在建立一个未来,在那个未来,任何想学习英语的人都将能够使用由各种语音识别、语音模型、语言模型驱动的软件,以一种比雇佣人类导师更好的方式大声说话并获得反馈。
Connor Zwick
在 Speak ,我们问自己一个问题,当你能够吸引不是1000万或2000万,而是1亿、2亿、3亿人积极学习语言时会发生什么,所以我们认为市场实际上比我们今天所看到的要大得多。
在 Speak 的长期使命中,我们一直努力帮助尽可能多的人实现他们的语言学习目标。因为我们相信,会说共同语言的人越多,世界就越好。所以我们的目标是成为人们学习任何语言的默认方式,无论是从完全的初学者,还是从移民到一个国家的人,也许你有一个轻微的外国口音想要摆脱,我们都在倾听并对此进行诊断和指导。
我们的最终愿景超越了语言学习,我们在这里构建和解决的机器学习挑战可以应用于几乎任何领域。基于最新机器学习模型的虚拟导师问题,不仅可以应用于不同的学科,还可以应用于任何其他人们与机器交流的用例。
AI+教育 讨论组 🥳
这期有机会和大家分享OpenAI投资的AI教育公司Speak,而我本人也有一段教育领域的学习&工作经历,借着这篇内容,我将和朋友一同组建一个“AI+教育”讨论小组,感兴趣的朋友欢迎加我微信「jiangtian26」备注/私信【AI+教育讨论组】,一起探索好玩的教育学习工具。
AI+教育 招聘 👻
这里插播一则招人广告,这是一家 EduTech 公司,公司总部在香港,项目依托于CUHK,业务ToG以及ToB,招聘需求如下:
性质:社招
位置:香港/深圳;
岗位:产品x1,前端x1;
要求:有中大型教育科技或C端成熟产品/开发经验优先;
欢迎各位推荐/自荐,具体请加我微信「jiangtian26」引荐,麻烦备注【AI+教育招聘】;
Reference:
EP.12 OpenAI bets $30M on this GPT-powered education appㅣConnor Zwick and Andrew Hsu, Co-founders of Speak,Entrepreneurs Unraveled;