厉害了!谷歌AI一键生成定制版3D游戏神兽可在线体验!

会画画的AI有多可怕?

你是否想象过把蚂蚁和猪、螃蟹和鲸鱼,或者100种生物的任意两个组合起来会是什么神奇的亚子?

顺风车并不是嘀嗒的首创,但在具体运行中,嘀嗒却在尽力坚持最优质、真实的顺风车服务。

互联网出行赛场,在滴滴收编优步中国的那一刻,仿佛终局已定!

完成涂鸦后,只要点击「转换」按钮,它就会自动生成3D效果的「怪兽」。

其一,从细分领域切入,避免了激烈竞争。

因此,它对训练数据集提出了一定的要求。现有的插图库不适合用作训练ML模型的数据集,原因是它们可能具有冲突样式,或者缺少多样性。生成嵌合体的数据集需要具备独特性,如戏剧性的视角、构图和灯光等。

使用这种方法,研究人员为每个3D生物模型生成10000多个图像+分割图对,与手动创建这些数据相比,用户每张图像可以节省大约20分钟。

训练后的模型,可以基于艺术家提供的轮廓,生成表现最好的多物种嵌合体并嵌入到 Chimera Painter中。

谷歌团队在博客中表示,希望这些GAN模型和Chimera Painter演示工具可以激发人们新的艺术创作思路。

嘀嗒一直奉行的,是“真顺风”模式,利用平台调控价格,坚持“真顺路、低定价”。

其二,把小生意,做到精致专业。

雷锋网(公众号:雷锋网)雷锋网雷锋网

嘀嗒的成功也告诉我们,在竞争激烈的商业市场,专注小而美,也不失为一条可取且十分有效的发展捷径!

而从一开始,嘀嗒就没有选择用这种方式抢占市场,嘀嗒并不给司机提供大额补贴,其平台上的司机,大多也并非以跑嘀嗒为生计。选择顺风载人,只是为了分摊出行成本。而乘客端,嘀嗒从一开始的定价就足够低,能很大概率促成顺风车服务。

谈及定位和竞争,宋中杰回应:“池塘里绝对不是只有我们一条鱼,我们希望成为大池塘里最大的鱼。”“重要的是每个玩家找到自己的路”。

为了训练 GAN,研究团队创建了一个全彩色图像数据集,其中包含单种生物的轮廓,这些轮廓改编自3D 生物模型。这种生物的轮廓描述了每种生物的形状和大小,并提供了一张分割地图来识别身体的各个部分。

相信很多人跟笔者一样,初听嘀嗒,还误以为是滴滴的子产品。可实际上,嘀嗒和滴滴,完全是两家独立的公司。

跟滴滴的全路线不同,嘀嗒从一开始,就选择了网约车这一细分领域。直至17年顺风车业务稳定之后,才选择投身出租车业务。业务稳定之后,也没有盲目扩张。嘀嗒的发展路线,稳定而专一,这也是嘀嗒发展至今的关键。

总之,对于艺术创作者或者绘画爱好者来说,Chimera Painter只需调整生物的局部形状、类型或者位置,就可轻松创建大量图像,而不是从头绘制几十种类似的生物。同时,该模型还允许使用外部程序(如Photoshop)创建的生物轮廓。

犀牛的犄角,老鹰的翅膀,恐龙的尾巴,组合起来就可以变成这样:

嘀嗒名字的由来,也早于滴滴。

如何向资本市场展示其光芒?嘀嗒给出了以下答案:

具体来说,主要有以下三个原因:

从上面的数据可以看出,嘀嗒主要专注于顺风车业务和出租车业务,而且已经做到了行业前列。

2014年,嘀嗒延用嘀嗒网的寓意,正式进击出行领域。

无论是对一个企业,还是个人来说,找准属于自己的方向,然后下定决心,不断提升自我,根据现实灵活变动,才是不断进步、直至成功的关键。

那么,使用机器学习作为画笔时,你想创建什么呢?(点击链接即可体验~)

那么,巨头林立之中,嘀嗒又是如何脱颖而出的呢?大多数人会觉得原因在于它成功在滴滴顺风车下线那段时间捡漏成第一,但没有十足的准备,又何以弯道超车呢?

图片中的颜色变化主要是数据集导致的,其原因是数据集中的一个生物往往包含多种纹理(比如蝙蝠的红色版和灰色版),不过,忽略颜色变化,许多差异也直接与感知损失值的变化有关。

不过,在这里研究人员提出了一种被称为条件GAN的变体,其中生成器采用单独的输入来指导图像生成过程。有趣的是,这种方法与其他GAN的工作完全不同,因为后者通常侧重于照片真实性,而该工具的目的是融合不同的物种生成一种嵌合体。

这6年,经历了滴滴快的激烈交锋,优步突袭,美团强势入局。就连提及这段历史,嘀嗒也很少被提到。

为了解决这个问题,研究人员开发了一种用户主导的半自动方法,即从3D生物模型中创建ML训练数据集。在这个过程中,用户们将创建并获得一组3D生物模型。

总之,在巨头林立的出行领域,嘀嗒虽然不是最受关注的那一个。但此次能先一步IPO,依旧证明了它是一个极具亮点的公司。这背后的运营模式和经营理念,值得进一步探究!

“滴滴和嘀嗒是什么关系?”

此外,出行领域向来烧钱,亏损是常态。而嘀嗒于19年已开始盈利,滴滴到今年才宣布开始盈利。这也说明,嘀嗒有充分的造血能力。

正因为如此,在18年的几次顺风车恶性事故之后,嘀嗒的“真顺风”模式迎来高速发展。

错位竞争,造就了小而美的嘀嗒。

从第一次创业失败,到嘀嗒二次创业,宋中杰的经营理念和运营哲学引人深思。

据介绍,日本防卫省计划在岛上建立相关设施,并已开始着手在附近海域进行地质调查。

基于GAN的生成模型

彼时,滴滴快的交战正酣。巨头林立之下,嘀嗒似乎并不起眼。然而,时过境迁,嘀嗒终于迎来了高光时刻。

而只需要我们点点鼠标随便涂个鸦,像这样:

该模型的训练过程利用的仍然是生成式对抗网络(GAN),GAN我们已经非常熟悉,它可以基于两个卷积神经网络:生成器和判别器生成高清且逼真的新图像。其工作原理是,生成器用来创建新图像,鉴别器用来确定这些图像是否来自训练数据集。

具体来说,他们将用虚幻引擎制作两组纹理,并叠加在3D模型上——一组具有全彩色纹理(左图),另一组显示身体每个部位(如头,耳朵,脖子等),称为分割图(右图)。

使用GAN生成新物种时会遇到一个问题,即在绘制图像细节或低对比度部分时,可能会失去空间的连贯性,包括眼睛、手指,甚至是具有相似纹理的重叠身体部位之间的区分。

最后,用户方面,截至今年6月30日,嘀嗒在全国366个城市提供顺风车服务,约有1920万位注册顺风车车主,包括约980万位认证顺风车车主,累计搭乘乘客数约为3670万,平均月活用户为1470万名。

下面是来自不同感知损失权重训练GANs的结果。

2011年,日美两国政府选定日本鹿儿岛县的马毛岛作为美军航母舰载机起降训练的备选地。马毛岛位于九州岛以南,隶属鹿儿岛县西之表市,面积大约8平方公里。

Chimera Painter,是一种机器学习(ML)模型。为了可以生成高质量且任意组合的怪兽形象,研究团队向模型提供数千张生物图像,并标记了如爪,腿,腿,眼睛等特殊部位,以供模型进行训练。

研究人员发现,特定值会产生更清晰的面部特征,使生成的生物更具真实感。

有意思的是,Googel研究团队还把Chimera Painter创作的怪兽形象用来搭建了一个数字纸牌游戏。

这款AI绘画神器名为Chimera Painter,它是一个Web工具,其功能是基于动物简图生成高度逼真的“小怪兽”。

据了解,这款AI工具的研发灵感就来自我们平时在游戏中看到的「怪兽」。Googel研究人员认为,这些怪兽的创作往往需要游戏美术师有高度的艺术创造力和技术知识,而AI可以充当画笔,帮助他们节省艺术创作的时间,比如一键完成3D渲染,甚至还可以增强他们的创造力。

其中,图二身体细分部分会提交给模型进行训练,以确保GAN了解各种生物身体部位的特定结构、形状、纹理和比例。

而在这一切策略的背后,站着的是嘀嗒创始人宋中杰。

现在,AI可以把这些天马行空的想象全部变成现实!

假如游戏中有100种动物,每种动物都可以相互融合,那么它会给任何艺术家带来很大的工作量,但这对于机器学习来说,是很轻松的事。

烧钱补贴,拥车重资产,一向是互联网出行领域的弊病。巨额补贴都是企业用以占领市场的法宝,然而,用钱烧市场对企业耗损极大。

更重要的是,它或许还能激发你的创意灵感,而这也是Google研究团队推出这款工具的目的之一。

创建有结构的生物数据集

截止目前,轻资产运营的嘀嗒,营收主要来自三方面,顺风车、出租车、广告。盈利面虽然窄了些,但这并不妨碍嘀嗒继续赚钱,稳固发展。

从CNN的不同层提取特征,并对每个特征施加权重,这会影响特征对最终损耗值的贡献,这些权重对于确定最终生成的图像的外观至关重要。

具体来说,研究团队通过感知损失( Perceptual Loss)对GAN进行了优化。该损失函数组件使用从单独的卷积神经网络(CNN)提取的特征来计算两幅图像之间的差异,该卷积神经网络之前已经对ImageNet数据集中的数百万张照片进行了训练。

目前,当地渔业协会已对调查表示同意,不过,由于防卫省想要开展调查必须得到马毛岛所属的鹿儿岛县政府许可,同时,西之表市市长的意见也将作为意见被参考,该县知事盐田康一的态度将成为今后此事进展的关键所在。

10月8日,嘀嗒出行向港交所递交招股说明书。

三维生物模型都被放置在一个3D场景中,并同样使用虚幻引擎。一组自动化脚本将采用这个3D场景,并在不同的姿势、视点和每个3D生物模型的缩放级别之间进行插值,创建全彩色图像和分割地图,形成 GAN的训练数据集。

顺风车领域,有“真伪”两大阵营,所谓“伪顺风车”模式,就是以顺风车之名,实际上并不顺路,而只是为了增加订单量。

2010年,嘀嗒出行创始人宋中杰创立限时团购网——嘀嗒团。嘀嗒暗含两层意思,一是时间紧迫,敦促用户下单;二是嘀嗒有水滴石穿的意思。

再者,营收方面,2017到2019年,嘀嗒出行总营收为4894万、1.2亿、5.8亿元人民币,毛利为2421万、6891万、4.6亿元人民币,净利润为-9702万、-10.7亿、1.7亿元人民币。2020上半年,营收、毛利、净利润分别为3.1亿、2.5亿、1.5亿元人民币。

妥妥地一幅专业创意作品,对绘画小白简直不要太友好。

GAN的超参数大小会影响模型输出图像的质量。为了验证该模型哪个版本的性能最佳,研究团队收集并分析了模型生成不同生物类型的样本,并从中提取了一些显著特征,如深度感,有关生物纹理的样式,以及面部、眼睛的真实感等。

首先,占有率方面,根据Frost & Sullivan弗若斯特沙利文咨询公司报告,按照出行次数计算,19年嘀嗒在中国顺风车市场占比近7成,高达66.5%。19年中国顺风车市场排名第一,出租车市场出行平台排名第二。

滴滴一枝独秀,笑傲网约江湖,是市场和用户的普遍认知。然而,巨头光环之下,嘀嗒也值得被看到。

正所谓,失败是成功之母。从前创业失败的经历,给了宋中杰很多启发。从一开始,宋中杰就十分确定,让嘀嗒坚持走顺风车这条小路线。如今回看,正是这一理念,让嘀嗒活到了今天。

雷锋网原创文章,。详情见转载须知。

谈及第一次创业失败,宋中杰回应:“随时摇摆、随时变换,不够坚定。”

其三,嘀嗒的模式够轻,懂得结合自身情况,量力而为。

报道称,八板还强调,“建立训练设施,失去的(比得到的)更多”,对基地建设计划表示了明确反对。

2014年嘀嗒出行成立,仅比滴滴晚两年“跑起来”。至今,嘀嗒的商业旅程已经走了6年。

下面是一些由GAN生成的生物,它们使用了不同的感知损失权重进行训练,展示了模型可以处理一小部分输出和姿势。

这些信息不仅将用于训练模型的新版本,而且能在模型生成成千上万的生物图像之后,从每种生物类别(例如瞪羚,山猫,大猩猩等)中选择最佳的图像。

图中每张纸牌的攻击值由上面的怪兽决定,这些怪兽的技能由他们所组合的两种物种决定。

那么,它是如何做到的呢?