10月の「都市とITとが出合うところ」は、「AIによる作画」です。テキストの説明文(呪文)を入力すると、画像を自動的に作成してくれる、AI画像生成技術について。
+++
AI画像生成サービス
AI(人工知能)は、時々刻々と発展している。
最近はユーザが、テキストの説明文(呪文)を入力すると、画像を自動的に作成してくれる、AI画像生成サービスが使えるようになってきた。いくつかを試してみた。
Midjourney
まず、「Midjourney」というAI画像生成サービスで、「realistic Hokusai Bigwave and Mt.Fuji」と呪文を入力したところ、1分ほどで画像が作成された(図1, 2)。
この呪文は、葛飾北斎の「富嶽三十六景 神奈川沖浪裏」を意識したものである。オリジナルの画像とは画風は異なるが、手前に海と波らしきものが描かれており、背景には富士山のような独立峰が描かれた。富士山を良く眺めてみると、山の白い辺りは、雪をかぶっているようにも見えるし、波のようにも見える。
DreamStudio Lite
次に、「DreamStudio Lite」というAI画像生成サービスを試してみる。「Stable Diffusion」と呼ばれるAIで計算している。「Midjourney」と同様に、北斎の「神奈川沖浪裏」を意識した呪文「realistic Hokusai Bigwave and Mt.Fuji」で出力してみた(図3)。
さらに、より具体的な呪文「The realistic Great Wave by Hokusai_ In the foreground, a small peaked wave forms a miniature Mt. Fuji, which is repeated hundreds of miles away」で出力した(図4)。
これらは、オリジナルの画像と完全に一致している訳ではないが、似ていることは間違いないであろう。AIは大量の画像で学習されているが、入力された呪文の一部に学習したテキストが含まれていたとしても、そのテキストに対応する画像がそのまま出力される訳ではなく、自動生成している。ただ、ここまで類似した画像が出力されたのは、「北斎」「Great Wave(「神奈川沖浪裏」の英語名称)」というテキストが強力だったのかもしれない。
他の画像も描いてみた。図5の呪文は、「The worship hall confronts the natural world covered with snow.(訳:雪に覆われた自然界に対峙する礼拝堂)」。
図6は、「Detailed oil painting of many Welsh Corgis laughing on the beach by CASPAR DAVID FRIEDRICH and CLAUDE LORRAIN, perfect lighting, golden hour(訳:CASPAR DAVID FRIEDRICHとCLAUDE LORRAINによる、海岸で笑うたくさんのウェルシュ・コーギーの詳細な油絵、完璧な照明、ゴールデンアワー)」。
図7は、水の教会を意識した呪文「A realistic chapel made in the plains of the central mountains of Hokkaido, the Church on the Water faces a reflecting pond through an engawa (veranda), in the center of which stands a solitary cross.(訳:「水の教会」は、北海道の中央山脈の平野部に作られた写実的な礼拝堂で、縁側を通して池に面しており、その中央には一本の十字架が立っています。)」で出力した結果であり、確かに山を背景とした平原に水面に反射したチャペルが描かれているが、実物とは異なっている。
Memeplex
上記2つのサービスは、呪文を英語で入力する必要があるが、「Memeplex」は呪文を日本語で入力できる(AIは、「DreamStudio Lite」と同じ「Stable Diffusion」を使用した)。
図8, 9は、呪文「建築家は、コンクリート打ち放しと木造を組み合わせて、大胆なデザインの美術館を海辺に設計した。」で出力したものである。
おわりに
AIが作画した画像を、現実の建築を建てる青写真として眺めると、現状では奇妙な出力も多く含まれている。
また、描きたい画像の具体的なイメージがある場合には、適切な呪文を用意しないと、思い通りの絵が出力されずに、イライラするかもしれない。
一方、自分自身が思いもよらない出力を得てみたかったり、もしくは、言葉足らずの呪文をまず入力してみてAIに画像を描いてもらい、その出力画像を見ながら、より具体的な呪文を入力していくと、思い描いた画像を徐々に描くことができたのも確かである。
予想通りの結果とは少し違っていても、意外な画像が出力された場合にはワクワク感を覚えた。このような刺激は、新たなアイデアを発想していく過程で大切なことのように思えたのは確かである。