用户只需在通义千问APP内输入“通义舞王”或“全民舞王”等口令,然后按照提示要求上传自己的照片。系统会在十几分钟内生成一个神形兼备的舞蹈视频,保留原形象的面部表情、身材比例、服装以及背景等特征。
然后,HandRefiner采用条件修补方法来处理识别出的问题手部。它生成一个深度图,其中包含了关于手部形状和位置的重要信息。这个深度图被用作指导,通过ControlNet集成到扩散模型中。最后,HandRefiner将重新画好的手部放回原来的画作中,替换掉原本画错的手,而其他部分保持不动,保持了原画的风格和内容。
与GPT-4V进行比较时,实验发现GPT-4V在所有对象识别任务中表现一致,但在对象级感知方面落后于VCoder。
久而久之,蛋仔的玩家群体就形成了一种「集体潜意识」,让整个游戏的氛围和创作形成了正向循环,所以你才能看到这么多感人的游戏行为和UGC创作。
我们大概就领先几个月,然后这个平台就公开,但是我们会开发更好的。