内容
連休中です
連休中ですが、仕事の開発業務が遅れていることもあり、ほとんど仕事してました。これが在宅勤務でなければ開き直って休んでしまうのですが、すぐに仕事に取り組める環境が近くにあるのは良いことではありません。
このままでは自分がかわいそうなので、一日だけ使って以前から関心があった生成AIによる画像生成がどんなもんなのか試してみたわけです。昨夜遅く、合唱団の練習から戻ってAI関連のインストール作業を開始したので、途中、昼呑み中断を挟んでの足掛け二日となります。
ツールとして選択したのは「Stable Diffusion」。ウチの自作PCには一応NVIDIAの古いグラボが入っているので、とりあえずWEBサービスやクラウドサポートを使わず、ローカルで回してみようかなと。
結果、惨敗。1024x768を一枚生成するのに20分もかかる。3GバイトのVRAMではこんなもんか。まーお試しなので、このまま進めた。
結論から先に
いろいろ試してみて、修正が必要な箇所は多々あるものの(一回20分もかかるので修正はしません)、気に入った二種がこちら。(以下、画像はサイズを縮小してあります)
背景はダメ。あと鼻も修正したい。
でもAI臭さが抑えられリアルになった頃の一枚
(顔を拡大)
このAI Modelは森の表現がおかしい。倒木が並んでる。
でも、他のクリエーター作品にないオリジナリティが出たように思う
絵ごころ、とは?
巷のAI生成物は、まだ完全にAI臭さが消えてるわけではありませんが、いずれはAIダ・ヴィンチが出てくる時代になるでしょう。現時点でもイラストレーターのお仕事が圧迫されているのでは?
自分はもともと絵心があって、趣味でXPPENの液晶タブレットを導入してイラストなどを描いていたこともありました。絵心があることを他人に言うことはありませんが、ささやかな自慢にしていたわけです。
しかし、プロンプトという単語を羅列したテキストだけで、ウチのボロPCでも20分あればハイクオリティな絵が描けてしまう。これまで一枚のイラストに一ヶ月もかけて描いていた自分の絵心って何なのだろうと悲しくなってくる。
しかもAIが人間の職域を侵食することは、趣味のイラスト描きに限った話ではなく、自分の本業であるエンジニア職も10年も経たないうちに確実に喰われていくことは容易に予測できます。
新しい世代のエンジニアは、AIのサブとして誰でもできる作業に従事することになるのではないか。生成AIでもプロンプトをAIに与えることは既にChatGPTを通して行われており、AIを通してAIが駆動されています。自分の世代がギリギリ、最後の職人エンジニアになるのかも。
また、技術系ではないですが、現実として、既にCMなどに生身のモデルさんではなく、AI生成物が使われ始めており、若い女性のお仕事も圧迫しています。
二日間の経緯など
いろいろと試した経過を順に書きます。でも、なんせ一枚に20分もかかるので、大した枚数はこなせてません。
最初の頃の出力。といっても昨晩のことですが。
適当にプロンプトを入力するだけでは
いかにもAIっぽい出力にしかならない。
そして、こういう絵ヅラは嫌い。
ちなみに歯並びにこだわっています
ここにくるまでたくさん試してきた結果、
ようやく顔にオリジナリティが出てきた。
でも体がおかしい
何度かモノクロになることがあった。原因不明。
背景は霧に霞む街、的なのを想定したつもりが、
映画『ミスト』の謎の霧が背後から迫ってくるような
ホラーちっくな画像に。顔の造りは良いのに。
また何故か胸の前が開いた服になっている
この一枚でチョット自信が出てきた。
背景は色指定なしのソリッドカラー
まぁ、悪くはないんですけどね。おっ○い強調しすぎ
髪の毛のディティールにこだわってみた。
でも髪がうるさすぎ。顔も嫌い
これはオリジナリティがあって良いですね。
髪に変なのが絡んでますが修正は面倒なのでしてません
最初のお気に入りの一枚のプロンプトに[Eguchi Hisashi]と入れてみたら、
シャツの前をはだけた出力となった。
狙ってません。それにおっ○いでかすぎ
これ、なかなかいいでしょう。
コスチュームはニンジャです。ここから次の流れに
ニンジャ 2.5次元
2.5DのAI Modelを使ってみました。もし、仮に欲が出て売り物にしようと考えたときにアニメ的な表現は欠かせないと考えたので。でも純然たる2Dは抵抗があって手が出せません。
ガチャガチャとうるさい絵ですが悪くありません。
背景をスッキリさせてあちこちを修正すればいい感じになると思う。
背景は[abstruct][random]なんかを使ってます。
あとおっ○いでかすぎ
これはコミック的なプロンプトを入れたので
マンガのカット割りっぽい背景になっています。
可能性を感じます
これは何を変更したんだっけ。
いずれにしろコミック的表現は使える
上下ヘッダーとフッターに意味不明なタイトルが
[solid color back ground]にして
ダイナミックな動きをつけたつもりが
体がおかしなことになっている。失敗作
上記のプロンプトをアジア系フォトリアルのAl Modelに
そのまま突っ込むとこうなった。
もはやニンジャコスチュームではないが、AIの創造性には驚く
非日本人的なアプローチ
ここまで日本人で描画してきました。次は[asian]とか[japanese]などのプロンプトを入れずに、西洋人的アプローチで【フォトリアル】と【2.5次元】を比較してみた
2.5DのAI Model。[dramatic lights]が効果的
2.5DのAI Model。
アールヌーヴォーというキーワードを入れてみたが
全くそれらしさは感じない
洋物フォトリアルAI Model。
上記と全く同じプロンプト。アール・ヌーヴォーが入っている
なのにパンツ一枚で現れた。
勿論狙ってません。それにおっ○いでかすぎ
洋物フォトリアルAI Model。
上記と全く同じプロンプトで、
アール・ヌーヴォーを[Impressionism](印象派のつもり)に
入れ替えたら服を着てくれた。
しかし何故に麦わら帽子なのかを考えたら
定番プロンプトの[cowboy shot](腿から上のショット)を
入れたせいだと判明
そこで[cowboy shot]を外して再度生成。
なんかつまらん絵になりました
最後に、上記のつまらない絵になったプロンプトを
そのまま2.5DのAI Modelにつっ込んだ結果。
これはいいですね
以上、足掛け二日間の記録でした。生成AIを出力するのに絵心は必要なくなったかもしれませんが、今のところはまだ、クリエイティビティが要求されるので結構楽しかった。時間を見つけてもっと精進します
ではでは。