☰

Google 释出新的机器学习API，开放识别影片中的图像

在以往的应用当中，使用者仅能够过在网站上输入关键字，搜寻文字，这包括文章中的文字，或甚至是相关的图片，而在未来这项应用，将扩大到影片的识别。未来人们可望透过第三方应用程式，用关键字直接搜寻影片当中的资讯。

就在稍早，Google 在旧金山举办的云端应用大会「Cloud Next」当中，发表新的机器学习API(称为Google Cloud Video Intelligence API)，让开发者得以标记影片当中的场景变化，利用 TensorFlow 框架量身订做机器学习模组的工具，借此自动提取影片当中的实体影像，让用户可以在应用程式当中用关键字搜寻影片当中的资讯，而且搜寻结果会越来越准确。

举例来说，未来只要在网站当中搜寻「腊肠犬」，那么除了图片跟文字，系统还会跳出内容有腊肠犬的相关影片出来。现场展示的是在搜寻引擎当中输入棒球、海滩等关键字，那么系统可以分别释出影片当中有棒球、球赛，或是海滩的搜寻结果。

▲搜寻「棒球」，就会出现内有棒球、球棒、球等相关影像的影片搜寻结果。（图／取自YouTube）

▲搜寻「海滩」，就会出现内有海滩影像的影片搜寻结果。（图／取自YouTube）

当然，虽然这个 API 相当好用，然而所有的影片都必须要储存在 Google Cloud 云端储存服务当中，若还不熟悉这个工具的开发者，可以到官网注册私人测试版试用。

Google 公司也公开表示，他们希望公开机器学习技术，让更多开发者得以开发出更方便的应用，除了Google Cloud Video Intelligence API，Vision API 是另一个例子。

相关资讯