当前位置: CompoTech China > 业界资讯 > 厂商资讯 >
 

人工智能新应用:英特尔让你妙变艺术大师

本文作者:英特尔       点击: 2017-03-03 09:02
前言:
Pikazo是一款利用特殊的神经算法把快照变成艺术作品的应用。

许多孩子天生就是艺术家,他们的蜡笔画被父母挂在冰箱上。随着年龄渐长,他们往往失去用艺术表达自我的自由灵感。当一个同事说她整个周末都在涂涂抹抹时,大部分人不会认为她在画画,而是以为她在粉刷房屋。

让手机摄影爱好者能够把自己的照片与名画模式相融合,从而创造出独一无二的数字艺术作品,这种天生的才能是人工智能(AI)设计师植入 Pikazo应用的一个特点。
 


Pikazo是在被其创始人称作“深度神经网络”的基础上开发的,这是一个模仿人脑和神经系统的计算机系统。充分利用人工智能并通过强大的英特尔计算性能而实现,这款应用让人们重新获得自己与生俱来的创造力并创作出具有大师风范的艺术作品。

与那些在人们记忆中转瞬即逝的Snapchat或Instagram图片不同,Pikazo所创作的作品更像是艺术品。

Pikazo联合创始人Noah Rosenberg表示:“人们会说:‘哇哦,我想再看看这幅图。’”

Pikazo之所以独特,是因为它不只是对图片进行过滤。相反,这款应用的神经网络会以意想不到的方式重新安排原始图片的元素——就像把面孔重铸到抽象肖像中。

Pikazo利用这种神经风格传输算法,把一个图片的风格融合到另一张图片中,从而创作出全新的作品——这个作品既有两幅原始图片的神韵,但是又与原图有天壤之别。

来自人和机器的艺术——它的运作原理是什么
Pikazo应用融合的两张图片,一张图片是“被画的”主题(例如一张自拍),另一张图片则显示画图的风格——可以是达芬奇的《蒙娜丽莎》也可以是毕加索的立体主义风格。

Rosenberg解释道:“如果我给它一张我的图片,再给它一张梵高的《星空》,它就会把这两张图融合到一起。”
 

原始图片

这就是它的运作原理。神经网络,或者模仿人脑的软件,包含经过训练可识别图片的探测器层。当Pikazo识别一个具体形状时,它激活一个特定的神经路径。检测器层让它能够对一幅图片进行深入理解。
 

Pikazo图片

英特尔优化Torch深度学习框架 助力Pikazo实现飞跃性突破
Pikazo的代码最初充分利用Visual Geometry Group和Torch现有的开源神经网络项目,这个机器学习框架可通过图形处理单元(GPU)来渲染图片。

这也是一个复杂的流程,神经网络必须运行在云中,而不是用户移动设备上。在云中可用的GPU只允许Pikazo处理300万像素的图片,需要花30-45分钟来创建,而渲染一张3.5兆的图片需要大概一个小时,这也几乎是GPU可以渲染的极限,这动辄数十分钟的渲染时间无疑非常影响用户体验。

为了寻找一个能够缩短渲染时间的解决方案,Rosenberg找到了英特尔。

英特尔帮助Pikazo迁移其神经网络代码库,使其运行在英特尔至强处理器和英特尔云服务上。并帮助其对Torch进行优化,实现飞跃性突破,
通过优化的软件,Pikazo能够不再依赖那些用来为应用生成艺术作品的昂贵的专用硬件。降低成本意味着Rosenberg能够降低通过该应用创建更大的海报尺寸版本的艺术作品的成本,从而大大加速了Pikazo的广泛普及。

正如Rosenberg所说:深度学习框架Torch的优化使得我们的成本降低了14倍,把在英特尔CPU上处理高分辨率图片的时间从超过1个小时缩短到大约5分钟。缩短低分辨率图片的处理时间也降低了免费处理图片的开销。大大提升的响应速度和更低的成本已经大大改善了Pikazo的业务。例如,Pikazo在2016年8月4日的一周内就处理了超过20万张图片。

Pikazo免费创建基本图片,并销售可创建更高分辨率图像的增强功能。一开始,高清图片的价格是15美元。现在,用户只需花1美元就能创作高清图片。

这帮助Pikazo增加了用户群并扩大了艺术创作的规模。Pikazo最初生成的图片打印出来只有3英寸——比智能手机的屏幕还小。Rosenberg说,现在Pikazo的内存容量足以支持大得多的图片。

Pikazo的成功,是英特尔积极布局人工智能领域的有力验证。英特尔公司软件与服务事业部副总裁开发者及产品部总经理Bill Savage 表示:为了推动AI应用的普及,英特尔注重开拓行业上游市场,增强行业影响力。而通过与开发源头的软件所有者合作,能够帮助其改善和优化产品,从而引导人工智能社会效益最大化。

英特尔正充分利用自身技术和产品创新的整合优势,为人工智能提供全面的、极为灵活的端到端解决方案产品组合:构建于业界领先的基于英特尔架构的涵盖至强处理器、至强融核处理器、Nervana平台和FPGA、Omni-Path网络、3D XPoint存储等技术的硬件平台,结合英特尔针对深度学习/机器学习而优化的英特尔数学函数库(Intel® MKL)、英特尔数据分析加速库(Intel® DAAL)等,和致力于为多节点架构提供卓越性能的开源软件框架如Spark、Caffe、Theano以及Neon等,及可推动前后端协同人工智能发展布局的Saffron、TAP、Nervana 系统、Movidius等工具和平台,以上这些产品组合将最终帮助广泛的行业和企业更方便地获取、开发和部署人工智能应用,将人工智能潜能在各个领域中充分释放,如智能工厂、无人驾驶汽车、体育、欺诈检测、生命科学等等。