Path: chuka.playstation.co.uk!news1.scei.co.jp!usenet From: minoru@isl.intec.co.jp (Minoru Matsumoto) Newsgroups: playstation.ny.resource.planning.discussion Subject: Re: =?ISO-2022-JP?B?GyRCPEI4M0UqOm5JShsoQg==?= Date: 9 Mar 1998 13:36:20 GMT Organization: INTEC System Laboratory Inc. Ltd. Lines: 105 Message-ID: <3503ed72p4502@base.minoru.isl.intec.co.jp> References: <34A7B860.4DD81829@mxz.meshnet.or.jp> <34C680E3.FE2@246.ne.jp> <34CA9D86.D174D276@mth.biglobe.ne.jp> <34CAC527.B4D@246.ne.jp> <34CADEC7.CEA0E759@mth.biglobe.ne.jp> <34cb5cbcpa321@base.minoru.isl.intec.co.jp> <6afpb8$gne@news1.scei.co.jp> <34cf1002pa069@base.minoru.isl.intec.co.jp> <6ave3f$6eh@news1.scei.co.jp> <34d743f8pa171@base.minoru.isl.intec.co.jp> <6bcf62$lqo@news1.scei.co.jp> <34dc66bepa577@base.minoru.isl.intec.co.jp> <6bscv0$as6@news1.scei.co.jp> <34e53163p1537@base.minoru.isl.intec.co.jp> <6c4f9h$kic@news1.scei.co.jp> <34e8490dpd802@base.minoru.isl.intec.co.jp> <6chkcf$7vu@news1.scei.co.jp> <34ee354fpb228@base.minoru.isl.intec.co.jp> <6csmh2$ld1@news1.scei.co.jp> <34f41747pb699@base.minoru.isl.intec.co.jp> <6dk0u5$k2p@news1.scei <6dpljm$qsu@news1.scei.co.jp> NNTP-Posting-Host: 210.132.156.33 Mime-Version: 1.0 Content-Type: Text/Plain; charset=ISO-2022-JP X-Newsreader: WinVN 0.99.7J PL01 (x86 32bit) cqz03222 の松本 実です。 In article <6dpljm$qsu@news1.scei.co.jp>, ji-tan@mtc.biglobe.ne.jp says... >恐らく、ここでいう局所解というのは、 > >(1) <34e53163p1537@base.minoru.isl.intec.co.jp> >+----- >| 特定の獲物だけを追っているおおかみは、その獲物には強いが、他はからしきダメ、 >| いろんな獲物を追っているおおかみは、オールマイティだが、専門家でない弱みが >| ある、という状況を作りたいのです。 >+----- > >のことを指しているんですよね? そうです。 >で、 > >(2) <34ee354fpb228@base.minoru.isl.intec.co.jp> >+----- >| 一応、ダーウィンの立場をとるつもりなんで、たくさんあるゲノムのうち、 >| よりよい学習ができるゲノムが生き残るイメージですね。突然変異でも違った >| 性質のゲノムができますが、交叉させるといい条件を広めやすい性質が >| あるらしいので、「頭のいいおおかみ」を作るのに適しているだろう、 >| と予想してます。 >+----- > >ここでいう「頭のいい」とは、「効率のよい学習則を持つ」 >という理解でよろしいのでしょうか? そうです。 >う〜ん。なんだかイメージがあんまり湧かないのですが、 >例えばおおかみが100頭いる場合、 >100個のNNと、100個の学習則を用意する、 >ということですか? NN は1個だけです(たぶん)。学習規則は 100 通り用意します。 >で、(1)はNNの局所解の話で、(2)はGAの話ですよね。 >ここで、学習則をGAで進化させるとなると、populationが1つならば、 >恐らく似たような学習則を持つおおかみが広がると思いますが、 >(つまり学習則に関しても局所解に落ちる可能性がある) >それはそれで構わないということでしょうか。 ああ、肝心なことをいい忘れていました。^^; GA によるゲノムの進化は、ゲーム中には行わず、事前に処理し、 データベース化します。また、データベースにはランダムに選んだ世代の ゲノムを格納します。新しいおおかみを導入する場合、このデータベースから (おそらくランダムに)ゲノムを取り出します。 学習則の収束の問題は、条件を変えて何回かシミュレーションを 繰り返せば、ある程度のパターンを得られるではないか、と安直に 考えています。 # 予想が覆される可能性もあります。^^; おおかみの構成に使用したゲノムの情報を、どうやってプレイヤに見せるかは、 検討中です。 >#僕はたぶん、NNの学習が進むに従って、全く学習しない学習則が >#広がるんじゃないかと予想します。 >#二重の意味で局所解に落ちるというか……。 そうですね。シミュレーションでゲノムを集める場合、これが コワイところですね。 >・同一のNNに対して、複数の学習則を用意しGAで進化 >・複数のNNを用意し、それらの構造をGAで進化 前者を考えています。というのも、 >直感的には、構造の異なるNNの学習則を客観的に評価できる >fitnessの定義、というのがピンとこないんですが。 >(つまり「よりよい学習ができる」の基準) で指摘されている通り、客観的な評価基準を作るのが困難なためです。 >例えば特定の環境下で効率のよい学習則、というのがあり得るとしても、 >それをちゃんと評価するのってとんでもなく難しい様な……。 (中略) >とりあえず、 > >・各おおかみはそれぞれ行動規則と学習則を持つ >・行動規則はNNに、学習則はGAにマッピングされる > >ということは大体分かりましたが、 >もうちょっと具体的なイメージをお聞かせ願いませんか? 獲物がとれた場合は参加した各おおかみにボーナスを与え、とれなかった場合は ペナルティを与える方向で考えています。この方法では、参加したおおかみの間で、 獲得する学習規則が均質化すると思われるため、適当に集団の変更をしようと 思っています。(つまり、群れから離れたり、入ってきたりします) >#恐らく学習則は、環境への適応性のアナロジーとなり得るんだと思いますが、 >#だとすると、過敏に適応しすぎて絶滅、とかいう状況も起こったりするんですかね? >#一体どんなことになるのか見当もつかないです(笑)。 ライフゲームではないので、絶滅はありません。 過敏に適応した場合は、育て方がうまければその道の専門家になるし、そうでなければ ぼんくらなダメおおかみになってしまうと思います。:-) --- 3月中 4月以降