主页 > 数码 >

微软不让你买 Office 2019?这是微软的AI,从研究到现实

时间:2019-02-14

来源:互联网作者:编辑点击:

为了寻求微软对人工智能感兴趣的起源,你需要在亚马逊,Facebook和谷歌开展业务之前顺利回归,更不用说人工智能的巨头了。

比尔盖茨于1991年创立了微软的研究部门,人工智能从一开始就是一个调查领域。三年后,在西雅图举行的全国人工智能会议上发表演讲时,销售主管史蒂夫鲍尔默强调了微软对人工智能潜力的看法,并表示他希望软件有朝一日会足够智能驾驶汽车。(他在抵达活动时在停车场撞了他自己的车。)

微软研究院(简称MSR)从一开始就聘请的不仅仅是计算机最有远见,最有成就的科学家。然而,长期以来,它一直致力于将创新转化为客户所需的功能和产品。例如,在90年代,我记得很困惑为什么它在语音识别领域的雄心勃勃的工作对Windows和Office没有产生深远的影响。

在Satya Nadella担任微软首席执行官五年后,这种耻辱感已经消失。对纳德拉的个人决心肯定有所帮助。微软负责人工智能和研究的执行副总裁哈里·舒姆说:“萨蒂亚让我们非常不耐烦地将更多技术应用到我们的产品中。” “这对微软研究中的所有人来说真的非常鼓舞人心。”这是很多快乐的人:超过1000名计算机科学家在MSR的工作,其位于雷德蒙德总部以及波士顿,蒙特利尔,北京,班加罗尔等地。

首席执行官的决心本身只是到目前为止。微软已经擅长于识别哪些研究可以利用哪些产品,鼓励广大员工在这方面进行合作,以及从工蜂到游戏爱好者的每个人面前获得结果的狡猾物流。

为了记录,Shum争辩说,微软的老代表未能利用其研究人员的突破是不公平的 - 但他并不否认该公司在他所谓的“部署驱动的研究”方面比过去更好。“现在关键是我们能够多快地实现这些目标,”他说。

从我最近访问其校园来看,微软正在将事情发生在一个只会加速的剪辑中。我和Shum以及公司内部的一些同事讨论了尽可能迅速和广泛地接受AI的过程。事实证明,这不是一个过程,而是一堆过程。

会议的思想

在最基础的层面上,确保Microsoft AI创新有益于Microsoft客户,就是确保研究和产品团队不会相互隔离。这意味着鼓励团队互相交流,微软现在以大规模,有组织的方式进行交流。例如,每六个月左右,一次名为Roc的活动就致力于研究工作与Office产品开发之间的相互促进。

“我们有两天,三天的研讨会,我们有50人来自微软研究院,100人来自Office,所有人都聚集在一起,”Shum说。每个人都分享他们正在做的事情,整个事件以黑客马拉松结束。

Harry Shum [照片:由微软提供]

另一个正在进行的思想会议,即杰出工程领导讲座系列,将负责产品的高管带到微软校园99号大楼,MSR总部位于此。“我说,'你必须进来为我做三件事,'”舒姆说。“排名第一的是告诉我们您的产品路线图。第二个是[list]你需要Microsoft Research为你解决的10件事。然后在你离开大楼之前排第三,承诺我们将一起工作的一两个项目。“

当然,让人们谈论问题和解决方案只是一个开始。AI可以改进日常Microsoft Office任务(如格式化文档或将数据插入电子表格)的巨大潜力。但是,很容易看出自动化辅助如何让人感到干扰而不是有用。图表A:Office 97的Clippy助手,仍然是光栅,不受欢迎的技术的典型代表。

在Office消除了Clippy之后的十多年里,它仍然希望检测你是否正在执行AI可能有用的任务。它只是希望体验是微妙的而不是侵入性的。正如Office的首席产品规划经理Ronette Lawrence所说:“我们的核心原则之一就是确保人类保持英雄。”

PowerPoint的设计构思功能可以使用AI来打扮您的幻灯片 - 但除非您想要使用它,否则很难避免使用它。

劳伦斯说,现在微软正在向Office添加的几乎所有东西都有人工智能和机器学习的元素。例如,在PowerPoint中,公司希望人工智能成为“为您在云中工作的设计师。”如果您使用的是配备笔的PC,例如微软自己的Surface,PowerPoint可以将您潦草的写意字和形状转换为抛光的文本块和对象。如果软件注意到您正在输入一系列日期,那么它会意识到将它们作为时间表排列可能是有意义的。

然而,劳伦斯说,“我们小心翼翼地确保将这些建议作为一种低语来表达,而不是在你脸上提出不请自来的建议”。“设计理念”功能可分析您的演示文稿,并显示可能调整的缩略图 - 例如幻灯片右侧的日期序列的时间轴布局。它们同样易于实施或忽略。

尽管许多Office功能都依赖于Microsoft Research的最新工作,但某些头脑风暴比其他人更容易在实验室中出现。“有些感觉就像是科幻小说,”劳伦斯以原始形式说道。“而其他[例子]更接近产品准备就绪。”

在Office产品团队和MSR之间的一次研讨会期间,人们通常会粗略地处理Word文档并在以后填补漏洞 - 或者要求同事做一些填充 - 这一事实出现了。如果Word帮助纠缠了这个过程怎么办?

一个新的待办事项功能旨在通过扫描文档的占位符来实现这一目的,例如“TODO:获取最新的收入数据”或“在此处插入图表”并将其列在侧边栏中,以便您记得要处理它们。微软计划扩展该功能,以便您的同事可以通过回复电子邮件而不是在您的文档中搜索来提供您所请求的元素。它还打算使用AI来建议相关内容。

第一批以初始形式访问此待办事项功能的Office用户是已注册Office早期采用者计划的Windows和Mac用户。(它将在年底前发布。)然而,通常情况下,新的人工智能功能首先出现在Office的基于Web的应用程序中,微软更容易在很多人面前快速获取并学习并且,如果公司需要以更传统的形式等待Office的下一个版本,那就完善了。

劳伦斯说:“听取反馈并了解人们如何使用它来训练模型对我们来说非常重要。” “这是微软新时代的一部分,当你发布它时,它不仅仅是功能的可用性。网络为我们提供了反馈机制。“

一个当前一系列的在线广告是专门展示了Office 365的服务具有的方便的功能是在Office 2019不存在,该套件的现收现付一次版本的数组。所有这些功能都利用了AI,但广告没有提及。毕竟,人类应该是英雄。

改变游戏

AI何时开始对视频游戏业务产生影响?如果你问微软Xcloud RD的合伙人总经理Kevin Gammill,他将会回到四十年前,带来早期的电脑控制对手,比如Atari的Asteroids街机游戏中的飞碟。“我认为人工智能已经存在,只要游戏一直存在,”他说。

Tamil Melamed和Kevin Gammill [照片:Harry McCracken]

在2019年,AI在游戏领域的潜在应用远远超出了为坏人做出决策的能力。微软 - 在游戏和基础计算机研究方面投入巨资的罕见公司 - 能够很好地探索它们。

这包括有用的东西,让游戏玩家的生活变得更好而不会尖叫“嘿,人工智能!”例如,研究表明,在线竞争极大地受益于玩家与其他大致相当的技能相匹配。Gammill解释说:“如果你进入游戏并且你只是被屠杀,那可能不是一次好的体验。” “如果每个人都太容易了,那也可能不是一个好的体验。”Xbox Live长期以来使用一种名为TrueSkill的算法(最近更新为TrueSkill 2)来帮助确保参赛者既不会被对手骚扰也不会被对手屠杀。

另一块实用人工智能的灵感来自微软“多年来从游戏玩家那里听到他们非常喜欢花更多时间玩游戏而不是下载游戏这一事实,”管理Game Pass服务的Ashley McKissick说道。在下载完成之前,该公司最初试图让玩家跳过行动,这个系统需要游戏发行商的一些繁重工作,因此并未普遍采用。

从去年夏天开始,微软用一种名为FastStart的AI增强技术取代了人类不满意的手工作品。它利用机器学习来确定首先下载游戏的哪些部分,允许游戏玩家开始播放速度的两倍。“我们在这里并没有真正改变物理定律,但它确实让你的下载变得更加智能,”McKissick说。

越来越多的微软正在将这种协作正式化,以帮助人工智能进入游戏领域。类似于名为Roc的MSR / Office会议,一个名为Magneto的confab旨在培养MSR和游戏组之间的对话和彻头彻尾的黑客行为。与这两个选区一起,“有人来自Bing,有人来自Windows,有人来自Azure,”微软Xcloud COGS合作软件工程师经理Tamir Melamed说。“因为我们认为我们可以分享很多这些技术。”

微软年度全公司黑客马拉松出现了一个联合项目。2017年,博彩集团正在努力应对策略混合器(一种游戏流媒体服务)的挑战 - 与Twitch相同的邮政编码,但更具互动性 - 微软以一家名为Beam的创业公司的形式获得了这种互动。“我们发现自己的流量比我们预期的要大得多,”Mixer的总经理查德吉布森说。“所以我们试图找到,'我们怎样才能提供新的,独特的方式来让PlayerUnknown的Battlegrounds或Fortnite的玩家被发现?'”

Chad Gibson和Ashley McKissick [摄影:Harry McCracken]

在混音器团队自问这个问题的同一时间,一些微软研究人员赢得了黑客马拉松,他们设计了“Watch For”,一个用于分析实时视频流和识别其中特定事件的AI系统。(微软对这项技术的商业可能性印象深刻,它

宣布了团队的胜利

而没有透露它所创造的确切内容。)两个团队合作使用Watch For作为HypeZone的基础,这是一个混音器功能,可让观众收听最多游戏中的高潮时刻正在进行中。吉布森说:“它让我们能够做出新的发现形式,我们真的认为这是不可能的。”

只要游戏有挫败感,AI应该提供进一步的方法来缓解它们。最近,Gammill参加了Tom Clancy第一人称射击游戏Rainbow Six Siege对三个朋友的激烈竞争。然后一名选手的互联网连接窒息。“我们三个人跑来跑去,一个冰冻的角色站在那里,”他说。除了被割下来之外,冻结的角色不能做太多。

更好的方案是,如果游戏可以使用AI来确定玩家已被切断,然后暂时控制相应的角色 - 并以与该人相同的风格进行游戏。“现在我们非常接近实际上已经实现的情景,”Gammill说。

硅因子

史蒂夫乔布斯喜欢说Apple是唯一一家构建“整个小部件”的计算机公司- 不仅仅是软件或硬件,而且两者都集成得非常好,以至于体验的接缝开始逐渐消失。近年来,由于Apple甚至设计了自己的iPhone和iPad处理器,并针对运行Apple软件进行了优化,因此该理念已达到最终表现。

对于智能手机或平板电脑来说,同样的垂直整合对于数据中心来说是有意义的,例如为微软Azure服务提供支持的数据中心。输入Project Brainwave。这就是微软设计的自定义硬件加速器的名称 - 使用英特尔现场可编程门阵列(FPGA) - 特别是为了加速在Azure云中运行AI。

微软为实现最佳人工智能而设计自己的硬件并不是独一无二的。无论谷歌和亚马逊从软件堆栈也向下移动到硅出于同样的原因。但微软并不只是在一个时髦的潮流中蹦极。项目Brainwave是Doug Burger几十年前开始思考的机会的最终产品 - 起初,他自己做了这件事。“我在2010年开始工作,然后在大约一年后将其暴露给管理层,”当时担任MSR研究员的伯格回忆说。

Brainwave项目源自微软认识到拥抱AI需要从芯片层面开始[照片:由微软提供]

常规芯片知道如何在它们出厂时执行其指令集中的计算指令,并且永远不能用于不同目的的再训练 - 例如有效地运行新的机器学习算法。相比之下,FPGA就像变色龙一样,汉堡说。“FPGA允许我们做的是快速构建内容并将其投入生产,然后以非常快速的节奏迭代,”他解释道。“因此,变色龙的颜色变化非常快,每次变色都会变得更好。”

FPGA技术使Microsoft能够以满足特定客户请求的方式提供高效的深度学习即服务。“他们想要解决的很多问题都是围绕图像分析,”Azure机器学习高级项目经理Ted Way说。“'我想看看我的制造缺陷。' “我想看一下[产品是否]缺货。” “我想知道人们是否在我的加油站吸烟,因为我害怕火灾。” Doug的团队能够扭转局面并构建这些卷积神经网络,这些网络在短短六个月左右就在FPGA上运行得非常快。“按照硅标准,这很快。

当Burger在2010年开始对FPGA进行个人调查时,至少对那些不具有先见之明的计算机科学家的人来说并不清楚 - 人工智能将如何迅速成为主流,更不用说将其作为服务提供将成为战略要务对于像微软这样的公司。很快,微软就明白了他的想法给Azure带来的价值。去年7月,在Brainwave项目离开实验室之后,Burger和他的团队也一样。今天,他们将继续作为Azure组的一部分而不是MSR。

这种情况并不罕见。“有关微软文化的一件事,研究和产品之间的界限已经模糊了很多,”汉堡说。“产品组有许多以前是研究人员并正在开发新产品的人。研究不仅有研究人员,也有工程师建设。这更像是一个连续统一体。“纳德拉,他补充说,”在推动这种创新方面做得很好。“

自助智能

借助Azure,微软正在与亚马逊和谷歌竞争,为各种企业提供人工智能和其他高级计算功能,作为按需服务。这不仅对外部公司有利; 微软内部也有一些团体可以从预先打包的AI和机器学习中受益。

例证:Codie,一个多语言聊天机器人,旨在提供有关编码的信息。现在是微软的一项内部实验,而不是商业产品,它源于这样一种认识,即潜在软件工程师的一个主要障碍就是可以访问有关Python编程语言中的命令和SQL数据库查询语法等信息。对于非母语英语人士来说,这个问题尤其严重。

Matt Fisher是Office 365和Microsoft 365的高级数据分析经理,也是Codie的创建者之一,他将该服务描述为“Cortana's geekier little sibling。”它来自Microsoft Garage,这是一个为员工提供鼓励和资源的计划。无论他们是否完全适合官方职责,他们都充满热情。创建该服务的团队中有15名具有不同背景的工作人员,包括开发人员,设计人员和营销人员。它击败了767个其他项目以赢得公司的雷德蒙德科学博览会,并在该公司的包容性挑战中获得了5,875个参赛作品中的第二名。

Afreen Rahman和Matt Fisher [照片:Harry McCracken]

使用基于文本的输入,Codie通过从Microsoft的Bing搜索引擎和用户到用户技术建议站点Stack Overflow中提取信息来回答编码问题。“在48小时内,我们有五种不同语言的东西,并从庞大的信息数据库中提取,因此您可以用西班牙语问一个编码问题并用西班牙语获得技术答案,”Afreen Rahman说道, Microsoft Store作为软件工程师的日常工作。

虽然Codie的创作者为企业带来了各种各样的技能,但他们都没有开始对AI有太多了解。“我们使用开箱即用的工具作为微软提供的AI套件的一部分,”Rahman说。“作为开发人员,我们能够立即获取文档并开始行动。”

费舍尔嘲笑为Codie提供支持的微软云产品:“我们使用了从Azure学习服务到LUIS语言理解的所有内容。QnA Maker,Bing图,Microsoft图,Azure bot框架,Azure语音插件。“那里有大量的Microsoft AI专业知识; 只是它是以即用形式出现的。对于Codie以及人们想要构建的许多其他东西 - 这就足够了。

为了将人工智能作为一种启发性技术用于鼓舞人心的目的,Codie已经取得了成功。构建它的人正在考虑升级 - 一个显而易见的是让用户说话而不是打字 - 以及如何使其广泛可用。“我们的目标是,我们希望看到它在微软的墙外使用,”费舍尔说。“我们正在努力实现我们需要做的事情来实现目标。我们得到了这个可爱组织Garage的支持,但在很多情况下,这是我们的第二或第三份工作。“

真正的问题,真正的研究

另一个关于微软对交叉授粉研究和产品的新方法:不仅仅是产品受益。AI对培训机器学习算法所需的数据类型有着无法满足的需求。作为世界上最大的科技公司之一,微软以匿名形式提供公吨数据。这意味着,如果有一段时间,其研究工作受益于为实际人类提供服务的赚钱业务,那就结束了。

“如今,要做很多非常令人兴奋的人工智能研究,你需要获得真正的问题并且需要访问数据,”Shum说。“这是您与[产品团队]合作的地方。您构建一个新模型,训练新模型,然后调整新模型。现在,您已经进一步推进了基础研究。一路走来,你永远不会知道 - 你可以获得突破。“

热门文章 更多>>