スペイン語の基本動詞リストを複数サイトから厳選する(100~1800個)
今日はスペイン語でよく使われている動詞や基本動詞をリスト化して公開されているものを14個集めてみました。
Table of Contents
比較方法
リストの作成目的やどこの国の話なのかによるので一概に比較は出来ないのですが、今回は無理やり比較しています。
比較の方法は各リストで取り上げられている動詞1つ1つに取り上げられた回数に応じて点数をつけて、リストの動詞の合計スコアで比較することにしました。
(2つのリストでestarがあればestarは2点と言った風に引用回数でスコア付けしています。)
動詞のスコア分布結果は下図です。
14個のリストのうち、全部に入っている動詞は45個で10点以上の動詞を集めるだけで115個の動詞リストが出来ます。
また、4点~9点の間は248個の動詞があるので10点以上の動詞リストと合わせると363個の動詞リストになります。
3点以下の動詞は数が多く、1437個ありますが今回は2点以下の動詞は0点として各リストを比較しました。(パクリ対策)
14リスト全部合わせると1800個の動詞リストが出来上がります。
動詞リスト100
1241点 linguasorb:100 Most Common Spanish Verbs
1240点 e languages ademy:LOS 100 VERBOS MÁS USADOS EN ESPAÑOL
1240点 SpanishDict: The 100 Most Common Spanish Verbs
1231点 LOS 100 VERBOS ESENCIALES EN ESPAÑOL:https://www.lancasterschools.org/cms/lib/NY19000266/Centricity/Domain/308/essential%20verbs%20key.pdf
1131点 123 Teach Me:Common Spanish Verbs – Top 100
100個動詞を覚えるという学習者に一番需要のありそうなリストなので、沢山見つかりました。
一番高得点なのはlinguasorbのサイトのリストでしたが、動詞を100個だけピックアップする場合に基本動詞と頻出動詞どちらを優先するかで点数に差が出やすくなってしまうと思われます。
動詞リスト200~300
2014点 My Daily spanish:200 Most Common Spanish Verbs [free PDF and audio]
2003点 Quizlet:200 VERBOS MAS USADOS EN ESPAÑOL
2472点 sporcle:SPANISH VOCABULARY: 300 MOST COMMON VERBS
2512点 300 Common Spanish Verbs.pdf:http://www.tangotools.com/spanish/300%20Common%20Spanish%20Verbs.pdf
200個の動詞リストは2つで、 My Daily spanishのリストが2014点と Quizlet のリストが2003点となっています。
これは200個中194個が同じで6個しか違う動詞が入っていない為に似たスコアになりました。
300個のリストになると少しリストにバラエティーが出てくるようで、sporcleと300 common spanish verbsでは300個中212個が同じ動詞でした。
動詞リスト 500~1000
2936点 EnglishnSpanish.com:500 Most Common Verbs Lists and Quizzes
3103点 Live Lingua:423 -AR Verbs , 106 -ER Verbs , 108 -IR Verbs , 273 Irregular Verbs
2556点 Spanish WITH TATI:1000 SPANISH VERBS: A COMPLETE LIST [+ FREE PDF]
2944点 Real Academia Española:http://corpus.rae.es/lfrecuencias.html (10000 formas más frecuentesから1008個の動詞を抽出)
動詞の数が500個を超えてくると、特定のリストにしか載ってない動詞が出てくる為にどうしてもリストの個数とスコアに乖離が出てきてしまいます。
ちなみにリンクはありませんが、14個目のリストとしてヨルスペオンラインさんで以前配布されていた400個の動詞リストも今回はスコア算出用データとして入れてあります。
頻出・基本動詞1800リスト
今回解析した動詞のリストをgitへ公開します。(https://github.com/samsumario/blog_public/tree/main/blog_813)
表はスペース区切りでスコア(puntaje)、動詞(verbo)、イレギュラー動詞かどうか(irregular)、英語翻訳(significado)の順に書き込んでいます。
上から順に高スコアの動詞をアルファベット順に並べているので、100個のリストが欲しい人は適当に100行コピペして使って下さい。
※ Real Academia Española の表から抽出した動詞の中に一部動詞で無いものが混ざっていました。spaCyで動詞判定をしていたのですが間違った判定がされていたと思われます。(後日気が向いたら修正…出来たらいいな)
動詞リスト解析の為のスクリプトチートシート
今回もpythonで処理しましたが、文字操作など苦戦したところを忘備録として公開します。
アクセント符号付きアルファベットの取得方法やリスト内の文字列長さの最大値が取れなかったりと色々基礎的なミスが多くて時間がかかってしまいました。。。