* U K I Y A H O N P O *
Nel mezzo del cammin di nostra vita mi ritrovai per una selva oscura,
che la diritta via era smarrita.
ホーム
一覧
検索
最終更新
リンク
ヘルプ
新規
リンク
手動リンク
自動相互リンク
駄でべWiki:FrontPage
ヘルプ
整形ルール
プラグインマニュアル
浮子屋商店もよろしく。
自作ソフト一覧/どくでんぱ。/仕様
をテンプレートにして作成
開始行:
* 外部仕様 [#f67f607c]
** コマンド一覧 [#v1a81baf]
- コマンドと引数の間は半角スペース1文字で区切ってください。
|コマンド|引数|動作|権限|返信SSTPEvent|Ref.0|Ref.1~|備考|h
|close|-|毒電波を終了します。|○|-|-|-|-|
|dokudenpa|キーワード|キーワードに基づいて毒電波文を生成...
|dokudenparandom|文章|文章から単語をランダムに選んで、そ...
|mode|モード文字列|毒電波生成時のモード文字列を指定された...
|gakusyu|文章|文章を学習します。|○|-|-|-|-|
|gakusyufromfile|ファイル名|ファイルから学習を行います。|...
|gakusyufromurl|URL|指定したURLの内容を学習します。|※1|-|...
|count|-|現在の単語数を数値で返します。|○|OnDokudenpaComm...
|option|key=value|オプションを設定します。|○|-|-|-|key=va...
|analyze|-|DBにanalyzeをかけます。|○|-|-|-|-|
|compact|-|DBの切り詰めを行います。|※2|-|-|-|-|
|@~|-|@が先頭に付いた場合、それをSQLとして解釈し結果を返...
- ※1…isExternalFileEnable オプションが有効で無いと permis...
- ※2…isSQLEnable オプションが有効で無いと permission deni...
- 毒電波生成時に、Ref.0が"busy"になることがあります。その...
- マルコフ連鎖がうまくいかない等、毒電波生成に失敗すると...
** オプション一覧 [#m8241698]
&color(Red){isSQLEnableやisExternalFileEnableをtrueにした...
|コマンドでの記述|設定ファイルでの記述|形式|内容|h
|maxlength|maxlength|数値|毒電波文生成時の最大長|
|lineend|lineend|文字列|毒電波文の最後につく文字の候補|
|balloon|isBalloonHint|true/false|バルーン表示あり/なし|
|mode|mode|文字列|モード文字列|
|不可|deleteRegexp|正規表現文字列|入力文字列から取り除く...
|不可|bunsyoRegexp|正規表現文字列|入力文字列を文章に分解...
|不可|notBunsyoRegexp|正規表現文字列|文章として認識したも...
|不可|databasename|文字列|データベースファイル名を指定し...
|不可|isTraceWnd|true/false|起動時のトレースウィンドウ出...
|不可|isSQLEnable|true/false|SQLコマンドを受け付ける/受...
|不可|isExternalFileEnable|true/false|外部ファイル読み込...
|不可|isMecabUse|true/false|単語の分解にMecabを用いる(tru...
|不可|isBusyOnGakusyu|true/false|学習中の毒電波生成はbusy...
** モード [#t3fba07e]
- モードは、IRCのログを読むような場合に利用可能な機能です。
- 文を学習した際のモードをDB内に記録し、modeオプションが...
- bunsyoRegexpは、グループ mode 、 グループ sentence を持...
- グループ mode にヒットした文字列があると、「学習時の現...
- グループ sentence にヒットした文字列は、「学習時の現在...
- 毒電波生成時に、mode オプションが空でなかった場合、マル...
- つまり、modeオプションが、レコードのmodeに含まれるレコ...
** DB構造 [#mf64b9f6]
- テーブルは tangotbl のみです。
|カラム名|内容|h
|main|メインとなる単語|
|pre|mainの前につく可能性のある単語、空欄の場合あり|
|post|mainの後につく可能性のある単語、空欄の場合あり|
|mode|この文を学習した際のモード文字列|
|count|pre-main-postの組み合わせが何回出てきたか(1ずつ...
- DBの切り詰めを行うと、countの最小値のレコードが削除され...
* 毒電波生成方式概要 [#x8396d96]
** 入力文のクリーンアップ [#d445db01]
まず入力文を日本語文字列のみに分解します。
- 最初に、 deleteRegexp にマッチするものを入力から削除し...
- 次に、bunsyoRegexpにマッチする文字列を複数取り出します。
- 複数取り出した文字列が、notBunsyoRegexp にマッチした場...
(例)
各オプションが初期値の場合;
(wizwiz) hogehoge \s[0]へもへもは「foobar」
これにdeleteRegexpをかけると
(wizwiz) hogehoge へもへもはfoobar
これをbunsyoRegexpで取り出すと
wizwiz←これを読んだ時点で、「学習時のモード」が wizwiz ...
hogehoge
へもへもはfoobar
これのうち、hogehogeはnotBunsyoRegexpにマッチするので、最...
へもへもはfoobar←これは、モード wizwiz としてDBに書き込...
** 形態素解析 [#j7304b78]
-Mecab を使う場合、Mecab で分かち書きをするだけです。
-Mecab を使わない場合、かなりヒューリスティックなルールに...
--文字種(ひらがな、カタカナ、漢字、その他)の区切りや、...
--「ー」は何かの単語の後に付くはず、といったルールも適用...
** DBへの書き込み [#o905a167]
- 分解された単語の組み合わせを、pre-main-post の形式で(...
** どくでんぱ生成 [#ac8fdd14]
*** マルコフ連鎖 [#jbbec4c3]
方式としては2単語によるマルコフ連鎖?です。
count の大きさが、そのレコードが選ばれる確率の大きさにな...
- 毒電波生成にはキーワードを用います。
- まず、キーワードが main と合致(或いはキーワードを含む...
- そのレコードの pre を新しいキーワードとします。
- レコードを選んだら、次は post が最初のキーワード、main...
- 同様にずらしながらレコード選択を繰り返し、preが空欄にな...
- preを辿っていき、空欄になるまで文字列を合成します。
- 次に最初に選んだキーワードからpostを辿っていき、同じこ...
上記に加え、オプションの mode が空でない場合は、mode文字...
*** その後のヒューリスティックルール [#f89f922a]
- 最後に、オプションのlineendから1文字選んでくっつけます。
- 先頭の「ー」や末尾の「、」と言った、日本語としておかし...
- 最終的な結果が与えられたキーワードと同じであった場合は...
終了行:
* 外部仕様 [#f67f607c]
** コマンド一覧 [#v1a81baf]
- コマンドと引数の間は半角スペース1文字で区切ってください。
|コマンド|引数|動作|権限|返信SSTPEvent|Ref.0|Ref.1~|備考|h
|close|-|毒電波を終了します。|○|-|-|-|-|
|dokudenpa|キーワード|キーワードに基づいて毒電波文を生成...
|dokudenparandom|文章|文章から単語をランダムに選んで、そ...
|mode|モード文字列|毒電波生成時のモード文字列を指定された...
|gakusyu|文章|文章を学習します。|○|-|-|-|-|
|gakusyufromfile|ファイル名|ファイルから学習を行います。|...
|gakusyufromurl|URL|指定したURLの内容を学習します。|※1|-|...
|count|-|現在の単語数を数値で返します。|○|OnDokudenpaComm...
|option|key=value|オプションを設定します。|○|-|-|-|key=va...
|analyze|-|DBにanalyzeをかけます。|○|-|-|-|-|
|compact|-|DBの切り詰めを行います。|※2|-|-|-|-|
|@~|-|@が先頭に付いた場合、それをSQLとして解釈し結果を返...
- ※1…isExternalFileEnable オプションが有効で無いと permis...
- ※2…isSQLEnable オプションが有効で無いと permission deni...
- 毒電波生成時に、Ref.0が"busy"になることがあります。その...
- マルコフ連鎖がうまくいかない等、毒電波生成に失敗すると...
** オプション一覧 [#m8241698]
&color(Red){isSQLEnableやisExternalFileEnableをtrueにした...
|コマンドでの記述|設定ファイルでの記述|形式|内容|h
|maxlength|maxlength|数値|毒電波文生成時の最大長|
|lineend|lineend|文字列|毒電波文の最後につく文字の候補|
|balloon|isBalloonHint|true/false|バルーン表示あり/なし|
|mode|mode|文字列|モード文字列|
|不可|deleteRegexp|正規表現文字列|入力文字列から取り除く...
|不可|bunsyoRegexp|正規表現文字列|入力文字列を文章に分解...
|不可|notBunsyoRegexp|正規表現文字列|文章として認識したも...
|不可|databasename|文字列|データベースファイル名を指定し...
|不可|isTraceWnd|true/false|起動時のトレースウィンドウ出...
|不可|isSQLEnable|true/false|SQLコマンドを受け付ける/受...
|不可|isExternalFileEnable|true/false|外部ファイル読み込...
|不可|isMecabUse|true/false|単語の分解にMecabを用いる(tru...
|不可|isBusyOnGakusyu|true/false|学習中の毒電波生成はbusy...
** モード [#t3fba07e]
- モードは、IRCのログを読むような場合に利用可能な機能です。
- 文を学習した際のモードをDB内に記録し、modeオプションが...
- bunsyoRegexpは、グループ mode 、 グループ sentence を持...
- グループ mode にヒットした文字列があると、「学習時の現...
- グループ sentence にヒットした文字列は、「学習時の現在...
- 毒電波生成時に、mode オプションが空でなかった場合、マル...
- つまり、modeオプションが、レコードのmodeに含まれるレコ...
** DB構造 [#mf64b9f6]
- テーブルは tangotbl のみです。
|カラム名|内容|h
|main|メインとなる単語|
|pre|mainの前につく可能性のある単語、空欄の場合あり|
|post|mainの後につく可能性のある単語、空欄の場合あり|
|mode|この文を学習した際のモード文字列|
|count|pre-main-postの組み合わせが何回出てきたか(1ずつ...
- DBの切り詰めを行うと、countの最小値のレコードが削除され...
* 毒電波生成方式概要 [#x8396d96]
** 入力文のクリーンアップ [#d445db01]
まず入力文を日本語文字列のみに分解します。
- 最初に、 deleteRegexp にマッチするものを入力から削除し...
- 次に、bunsyoRegexpにマッチする文字列を複数取り出します。
- 複数取り出した文字列が、notBunsyoRegexp にマッチした場...
(例)
各オプションが初期値の場合;
(wizwiz) hogehoge \s[0]へもへもは「foobar」
これにdeleteRegexpをかけると
(wizwiz) hogehoge へもへもはfoobar
これをbunsyoRegexpで取り出すと
wizwiz←これを読んだ時点で、「学習時のモード」が wizwiz ...
hogehoge
へもへもはfoobar
これのうち、hogehogeはnotBunsyoRegexpにマッチするので、最...
へもへもはfoobar←これは、モード wizwiz としてDBに書き込...
** 形態素解析 [#j7304b78]
-Mecab を使う場合、Mecab で分かち書きをするだけです。
-Mecab を使わない場合、かなりヒューリスティックなルールに...
--文字種(ひらがな、カタカナ、漢字、その他)の区切りや、...
--「ー」は何かの単語の後に付くはず、といったルールも適用...
** DBへの書き込み [#o905a167]
- 分解された単語の組み合わせを、pre-main-post の形式で(...
** どくでんぱ生成 [#ac8fdd14]
*** マルコフ連鎖 [#jbbec4c3]
方式としては2単語によるマルコフ連鎖?です。
count の大きさが、そのレコードが選ばれる確率の大きさにな...
- 毒電波生成にはキーワードを用います。
- まず、キーワードが main と合致(或いはキーワードを含む...
- そのレコードの pre を新しいキーワードとします。
- レコードを選んだら、次は post が最初のキーワード、main...
- 同様にずらしながらレコード選択を繰り返し、preが空欄にな...
- preを辿っていき、空欄になるまで文字列を合成します。
- 次に最初に選んだキーワードからpostを辿っていき、同じこ...
上記に加え、オプションの mode が空でない場合は、mode文字...
*** その後のヒューリスティックルール [#f89f922a]
- 最後に、オプションのlineendから1文字選んでくっつけます。
- 先頭の「ー」や末尾の「、」と言った、日本語としておかし...
- 最終的な結果が与えられたキーワードと同じであった場合は...
ページ名: