ぱろすけ's website

画像補完技術による衣服の除去

概要

画像補完技術とは画像の欠損部分をそれらしく埋め合わせる技術のことをいう。この技術は古くから職人技として知られ、傷んだ写真の修復や写真からのトロツキーの除去などに広く用いられてきた。

近年では画像補完を自動的に行う技術の発展が目覚ましい。Hays らは、風景画像の欠損部分に合う画像を風景画像データベースから検索することで、風景画像の一部をまったく違う(しかし見た目には自然な)風景画像へと置き換えることに成功している。このような外部画像データベースを用いる手法は一種の「脳内補完」として機能しているといえる。

ところで、一般に「脳内補完」の主要な適用先は着衣状態の無着衣化である。彼らの手法のうち、風景画像データベースを裸体画像データベースへと置き換えることで、着衣画像の裸体化が行えることが期待される。

本プロジェクトでは上記着想の実装を行い、その実験結果を示す。

なお、本プロジェクトページは性的な表現を含むため18歳未満の方は閲覧しないようご注意いただきたい。また、本プロジェクトページに掲載する画像はモザイク処理を施してある。原画像については原論文を確認いただきたい。


序論

衣服の透視、あるいは着衣画像からの無着衣画像の生成は、永らく人類のロマンであった。そのような妄想を試みる者は数多く、いわゆる「透視メガネ」を騙されて購入する中学生も後を絶たない。20世紀以降、セキュリティ上の懸念という名目で赤外線やX線などを用いる透視の研究が進展しつつあるが、未だに高精度な透視は達成されていない。

着衣画像から衣服の除去を行う技術には多くの応用可能性がある。コンピュータビジョンについて考えるならば、着衣の除去により人物の姿勢、性別、年齢などの推定が容易になることが期待される。日常生活における応用については読者の妄想に任せたいが、多種多様な応用が想起されるであろう。

画像からの衣服の除去は、人類の永年の課題であり、その技術は多くの応用可能性を持つ。本研究はそのようなシステムの構築を目標とし、裸体画像データベースと画像補完技術を用いた手法を提案する。提案システムへの入力例と出力例を図1に示す。ユーザは、脱衣対象となる画像に加え、除去すべき部分を指定するマスク画像をシステムへと入力する。

図1: 提案システムへの入力例および出力例

なお本プロジェクトは画像中の人物の衣服の除去のみを目標とし、出力画像のもたらす興奮作用によりユーザ諸兄の衣服の除去に至ることまでは目標としないことに注意しておく。また、本プロジェクトの登場人物は全員18歳以上である。

関連手法

画像から着衣を除去する手段として Photoshop などの画像編集ソフトウェアが広く用いられているが、画像加工には高度な専門技術と非常な手間を要し、手軽な手段とはいえない。また、いわゆる「アイコラ」に対する取り締まりは厳しく、逮捕に至る職人も数多い。

より手軽な代替手段として、人類の認知機構を活用した手法がいくつか提案されている。水玉コラと呼ばれる手法では、露出の多い画像に対し、着衣部分を隠すような水玉を構成することにより対象を裸体であるかのように知覚させる。この手法については自動化システムも提案されている [1]。その他、着衣部分を肌色で塗りつぶし、さらにモザイクをかけることにより全裸感を演出する手法も提案されている。また、顔の重要性に着目し、類似した顔の女優の出演する成人向け動画を鑑賞することで近似的に満足感を得る手法も提案されている [2]。

直接的な着衣除去の手法として、画像から不要な部分を除去し、該当領域を埋め合わせる方法が考えられる。このような方法の代表的なものとして Hays らの手法[3]が挙げられる。彼らの手法の典型的な入力例と出力例を図2に示す。

図2: Hays らの手法の使用例

彼らの手法による結果は非常に印象的ではあるが、風景写真の補完のみ報告されており、衣服の除去への応用の可能性については検証の余地が残されている。本プロジェクトでは彼らの手法を衣類除去問題へと適用する。

提案手法

このプロジェクトページを閲覧者の多くは手法の詳細にそれほど興味を持たないであろう。以下に手法の概要のみを述べる。詳細については原論文 [4] を参照されたい。

本プロジェクトでは以下のように着衣画像の裸体化を行う。

    * ユーザが着衣画像を入力する。 * ユーザが着衣画像のうち除去すべき衣類の占める部分を入力する。 * システムは、大規模裸体画像データベースから、指定領域に自然に当てはまる部分画像を検索する。ここでは、指定領域周辺の輪郭情報を用いて自然さを判定する。検索の説明図を図3に示す。裸体画像データベースとして2ちゃんねる半角二次元板の「裸の立ち絵の画像スレッド」に含まれる画像を用いる。データベースに含まれる画像の例を図4に示す。 * システムは、検索により得た画像を元画像へと合成する。ここではポアソン画像合成 [5] を用いる。

図3: 補完用画像の検索

図4: 画像データベースに含まれる画像の例

実験

本節では、提案手法による実験結果を二次元画像と三次元画像についてそれぞれ示す。

二次元画像

図1は提案手法を貧乳画像に適用した結果である。上半身、下半身の双方において適切に衣服の除去が行われていることが確認できる。

貧乳画像では胸のたゆみの自由度が低く描画領域が狭いため画像の多様性は低い。そのためデータベース中から類似した輪郭を持つ画像を得ることは比較的容易である。しかし巨乳画像(ビッグデータ)においては、たゆみのバリエーションの多様さや描画領域の広さから、似た輪郭を持つ画像は比較的少数になると考えられる。ビッグデータへの提案手法の適用例を図5、図6に示す。双方ともに入力画像に含まれる谷間のラインに合ったビッグデータが良好に合成されている。この2つの結果はビッグデータの扱いの困難性に対し提案手法が有効であることを示している。

図5: 提案手法のビッグデータへの適用例1

図6: 提案手法のビッグデータへの適用例2

提案手法の適用範囲は下着や水着などの限定的な領域に限らず、たとえば上半身の衣服を一気に除去することも可能である。その検証のためワンピースを着用している画像に対して提案手法を適用した。生成された画像を図7に示す。この画像は違和感なく上裸化されており、提案手法の適用範囲が下着や水着に留まらないことを示している。また、提案手法により顔を入れ替えることも可能である。顔に対して提案手法を適用した例を図8に示す。自然に顔を入れ替えることが可能であることが見て取れる。

図7: 提案手法による上半身の裸体画像化

図8: 提案手法による顔の入れ替え

三次元画像

三次元画像に提案手法を適用した結果を図9、図10に示す。ここでは二次元画像データベースではなく三次元画像データベースを別途構築し用いた。

図9: 提案手法の三次元画像への適用例1

図10: 提案手法の三次元画像への適用例2

図9では衣服は適切に除去されている。また、出力画像は入力画像と比べややビッグデータと化していることが読み取れる。

図10では着衣は完全には除去されず上にずらした形の画像が出力されている。これは、データベースからそのような画像が選択されたからである。用いた三次元画像データベースは二次元画像データベースに比べ品質が低く、全裸ではない画像を多く含むが、その弊害が顕在化した結果であるといえる。

結論と展望

本論文では着衣画像から衣服を除去する手法を提案し、その有用性を実験的に検証した。

提案手法は大きな課題を2つ抱えている。ひとつは、入力画像に対して出力画像が一定であり、個人の趣向に合わせた画像の生成が行えないことである。ユーザとのインタラクションの導入によりその制限が克服されることが期待される。もうひとつは計算量の多さである。今回の実験では1枚の画像の加工に数十分を要するためスマートフォンのカメラを通じたリアルタイム透視システムなどのアプリケーションに対しての適用は困難である。また、計算量の軽減はより大きな画像データベースを用いることを可能にし、生成される画像の精度の向上にもつながるであろう。

速度の高速化のための有望なアプローチとして GPGPU の利用が挙げられる。高額であるため購入を断念したが、今後の発展のためにご支援いただければ幸いである。

データドリブンの衣服除去技術(擬似透視技術)はこれまであまり研究されてこなかった領域である。しかしながら、本プロジェクトの結果はこのアプローチの有用性を強く示している。人類のロマンの実現へと向け、本プロジェクトがその第一歩となることができれば光栄である。

参考文献

関連リンク


Copyright (C) 2014-2016 ぱろすけ. All Rights Reserved.