HISTORY 解放の経路
ダメな人(英語難民)を無能ループから解放するための発話向け練習環境と練習対象データを作る。
ステージ1
対面発話の練習相手とは何か。練習対象で練習相手を代用する。
英会話の練習と言えば対面発話が既定手段であり練習相手を必要とする。
練習対象があれば単独発話が可能になり練習相手を補える。
当面の目標
- 練習対象を活用するための入れ物を作る。
- 単独発話を支援する自動ヒント機能を作る。
- 練習対象への接触頻度を保つための習得管理機能を作る。
アプローチ1:練習の条件
単独発話を支援する装置の要件は何か。自主トレ支援装置を作る。
練習の前提は
練習対象と
練習相手。2つが揃えば発話練習可能、揃わないと練習は無理。
⇨
発話教材
課題1.入れ物
ここで練習相手を
誘導装置と捉えれば
単独発話も可能。
一文等価の対訳で
自主トレの道がある。
それは入手可能テキストを活用するための「入れ物」。機能性「入れ物」(発話
誘導装置)。
課題2.巡回可能な練習対象
自主トレでは自分の発話部品になるまで練習対象を巡回して習得する。
そのために巡回可能な一定サイズの練習対象を用意する。
映画字幕を
習得単位として「入れ物」に入れて何単位か習得してみる。
⇨
プラグイン
課題3.練習負荷と方向定位
あるフレーズを自力で言えるようになるためどう練習し、確認するか。
練習対象に
自動ヒントを適用すれば自主トレができる。
⇨
練習負荷
⇨
方向定位
⇨
復元トライ
アプローチ2:応力集中、適正規模
映画字幕の単位をそのまま練習対象の区切りとして自主トレができるようになった。
念願の
練習環境が揃った。では映画一タイトル全編で発話レベルに到達したら手応えはどの程度か?最低必要な練習単位は映画何タイトル分か。実際に習得して試す。
課題1.文脈本位は粗大になる
練習単位を積み上げながら最短で発話閾値を目指すのがプラグイン語学の発想でした。
しかし映画字幕は日用と非日用の語彙が混在するために応力集中と適正規模が保てない。
必須発話部品を文脈本位の材料で網羅しようとすれば無駄が多すぎて教材が粗大になる。
ステージ2
日用・非日用語彙が混在する一般の語学教材は発話の練習対象にならない。
練習対象を抽出する方法を検討する。発話有効成分のみを畑から抽出、それ以外を省略する。
練習対象を集約して
適正規模まで
軽量化。軽量化を通して発話への最短コースを実験的に追求する。
当面の目標
- 練習対象を抽出するための集約装置を作る。⇨ 不要物除外
- 出る順に基づく用例抽出。
アプローチ1:集約装置、出る順
課題1.出る順で全文検索
文脈本位の習得単位を解体し、出る順リストに基づき
用例本位で練習対象を抽出する。
習得効率をあげるために練習対象を大胆に集約する。字幕単位の枠にもう拘らない。
課題2.用例の構造化
検索タグと集約モードの強化による
集約装置の重点化。
検索タグに基づいてタイトル横断的に抽出して閲覧VIEWに表示すればシームレスになる。
⇨
用例統合
⇨
検索タグ
- 学習段階で汎用性の高い例文に検索タグを仕込む。
- 検索タグで教材を増やさず練習対象を抽出する。
- 検索タグで練習対象をグループ化する(分類・用例)。
アプローチ2:基本例文を整備する
集約装置による用例抽出ではどうしても寄せ集め感が強くなる。
大半は何の取り柄もないから、その中から良い例文を選別して初めて練習対象になる。
課題1.用例コアを個別に選別
用例集約の作業は映画字幕を使うより格段に手間がかかります。
しかし一度整備されると強力な武器になるから
用例コアを整備する作業に現在傾倒しています。
⇨
手応え本位
⇨
接触頻度の最適化
ステージ3
日用語彙の用例を個別に収集、集約し可能な限り用例幅を網羅する。
⇨ 必須表現
集約装置のみでは教材の軽量化が徹底できない。
適正規模の
練習対象を予め
用例本位で収集したい。
当面の目標
練習対象と専用ツールを作る。
⇨
適正規模
- Web から入手できる語学データを収集する。
- 練習マシンに投入済みの語学データから発話有効成分を抽出。
- 対訳形式のテキストを入れて自動ヒント化する。
アプローチ1:発話練習ツール・発話プラン
入力志向教材のコンテンツは料理本のごとく remix から作られ種類も無数に存在する。
混ぜるのは簡単だが精製するのは特別なエネルギーを要する。必要最小限の汎用例文に集約する作業の繰り返しから作られる。
アプローチ2:用例本位
適正規模・汎用性・大分類
日用語彙の用例を集約する。
⇨
発話用例集
①大雑把に抽出した後に個別に調整(隠蔽除外符号)。
②フレーズの構造/役割毎に大きく仕分けする(分類)。
自主トレ体験、発話自由度体験
基本
発話部品を身につけることで言語の
フレームワークを構築する。発話先行により追加的要素は文の骨格上に位置づけられ、定着しやすくなる。だから発話練習ツールを汎用的な
発話教材として公開し訪問者の発話自由度体験に供する。
⇨
発話部品演習
ステージ4
聞き取り(聴解力)と聞き流し系。
TV録画音声を利用して洋画の聞き取り訓練すると位置合わせと音便(リエゾン)で苦戦する。
合成音声で選択的聞き流しできるように字幕閲覧ツールを改修。
⇨ 音声装置(合成音声)
どちらも字幕文字データが有れば合成音声を利用できる。対象都度指定式なら無駄がない。朗読の精度はいろいろ存在する。聴くに耐えないものもあるが語学目的で使える品質のものもある。
当面の目標
聞き流し効果を
実用的効果へ高める。
JavaScript で操作できれば語学ツールとして使える。操作性と朗読品質を追求する。手間がかかって面倒なので中断。
ステージ5
テキスト見出し行で自動ヒント対象の制御ができるように発話教材を改修。
発話用例集を用例本位に最適化する。発話特区(発話第一水準)を定義した。
⇨ 発話自由度
発話第一水準=語彙第一水準(2000)×用例(必要最低限)。
発話部品は有限だから、この範囲で用例を網羅的
軽量化レベルと共に
費用対効果が高まる。過不足なしで最短発話コース。
当面の目標
テキストを
用例統合して
軽量化(最適化)する。出る順上位1000単語の用例を補充する(発話欠損を予防)。
発話用例集の用例を追加・取捨選択し
用例本位に最適化する。スペイン語動詞活用の練習対象一覧作成。
ステージ6 ㊗️
今までの穴埋め問題2.0 は人様にお勧めできない品質だったが、今後は自信作になる。
穴埋め問題化では空欄対象の制御が長らく課題だった。過去ステージはその逃避また弥縫策。
隠蔽すべき単語は用例ごとに変わるので、ある単語を常に表示/隠蔽すると的確な隠蔽ができない。
そこで自動ヒントを全面的に見直して品詞別隠蔽を新しく自動穴埋め問題化の標準ロジックとする。
これに伴い想起訓練の内容を補完◯作文から単語選びに変更。長年の懸案がほぼ解決した。
新規言語に初めて取り掛かる場合、なるべく早く本文を理解するための補助として、単語集から読み込んだ注解を本文中に埋め込むことを試した。もともと
自主トレとは別の単なる思いつきから始めたこと。作ったあと長らく放置していたが、注解目的ではなく穴埋め問題の隠蔽タグとして利用することを思いついた。作ってみたら自主トレ補助機能として実用的レベルになっていた。
当面の目標
隠蔽対象を品詞別に切り替えれば的確な練習ができるように用例集と語彙集を補う。
単語選びの訓練対象は
日用語彙リストの範囲に限られる。
発話用例集の用例内語彙が大部分カバーされるように
日用語彙リストを補充する。※言語によっては不十分
逆走条件を目指す