Google 释出新的机器学习API,开放识别影片中的图像
在以往的应用当中,使用者仅能够过在网站上输入关键字,搜寻文字,这包括文章中的文字,或甚至是相关的图片,而在未来这项应用,将扩大到影片的识别。未来人们可望透过第三方应用程式,用关键字直接搜寻影片当中的资讯。
就在稍早,Google 在旧金山举办的云端应用大会「Cloud Next」当中,发表新的机器学习API(称为Google Cloud Video Intelligence API),让开发者得以标记影片当中的场景变化,利用 TensorFlow 框架量身订做机器学习模组的工具,借此自动提取影片当中的实体影像,让用户可以在应用程式当中用关键字搜寻影片当中的资讯,而且搜寻结果会越来越准确。
举例来说,未来只要在网站当中搜寻「腊肠犬」,那么除了图片跟文字,系统还会跳出内容有腊肠犬的相关影片出来。现场展示的是在搜寻引擎当中输入棒球、海滩等关键字,那么系统可以分别释出影片当中有棒球、球赛,或是海滩的搜寻结果。
▲搜寻「棒球」,就会出现内有棒球、球棒、球等相关影像的影片搜寻结果。(图/取自YouTube)
▲搜寻「海滩」,就会出现内有海滩影像的影片搜寻结果。(图/取自YouTube)
当然,虽然这个 API 相当好用,然而所有的影片都必须要储存在 Google Cloud 云端储存服务当中,若还不熟悉这个工具的开发者,可以到官网注册私人测试版试用。
Google 公司也公开表示,他们希望公开机器学习技术,让更多开发者得以开发出更方便的应用,除了Google Cloud Video Intelligence API,Vision API 是另一个例子。