私は現在、XMLフレーバーの基本的なパーサーを書いています。演習として、LLテーブル駆動型パーサーを実装しています。 これは私のBNF文法の例です。 %トークン名データ文字列 %% / * LL(1)* / doc:elem elem: "<" open_tag open_tag:名前attr close_tag close_tag: ">" elem_or_data "" name ">" | 「/>」 ; elem_or_data: "<" open_tag elem_or_data |データelem_or_data | / *イプシロン* / ; attr:name ":" string attr | / *イプシロン* / ; この文法は正しいですか? 各端末リテラルは引用符で囲まれています。抽象端末は%tokenで指定されます。 入力をトークンリストに変換するために、手書きのレクサーをコーディングしています。抽象端末をトークン化するにはどうすればよいですか?
2021-03-03 08:11:04
古典的なアプローチは、可能な端末ごとに正規表現(または他の認識機能)を作成することです。 完全に具体的な「抽象」端末と呼ばれるものは、実際には、関連するパターンが複数の可能な入力文字列を認識する端末です。実際に認識された文字列(またはその文字列の計算された関数)は、トークンのセマンティック値としてパーサーに渡される必要があります。 名目上、入力文字列の各ポイントで、トークナイザーはすべての認識機能を実行し、一致が最も長いものを選択します。 (これはいわゆる「最大ムンク」ルールです。)これは通常、特にすべてのパターンが正規表現である場合に最適化できます。たとえば、(F)lexがその最適化を行います。 あなたの場合の複雑さは、あなたの言語のトークン化が文脈に依存しているということです。特に、ターゲットがelem_or_dataの場合、可能なトークンは<、、および "data"のみです。ただし、タグ内では「データ」は使用できず、「名前」タグと「文字列」タグは使用できます(特に)。 属性の値がキーと同じ字句形式(つまり名前)を持つ可能性もあります。 XML自体では、属性値は引用符で囲まれた文字列である必要があり、引用符で囲まれていない文字列を使用するとエラーとしてフラグが付けられますが、空白のない属性値を挿入できる「XMLに似た」言語(HTMLなど)は確かにあります。引用符なし。 字句解析はコンテキストに依存するため、字句アナライザーには、字句コンテキストを定義する追加の情報を渡す(またはアクセスする)必要があります。これは通常、単一の列挙値として表され、返された最後のいくつかのトークンに基づいて、または現在のパーサースタックの最初のセットに基づいて計算できます。 2 | あなたの答え StackExchange.ifUsing( "editor"、function(){ StackExchange.using( "externalEditor"、function(){ StackExchange.using( "スニペット"、関数(){ StackExchange.snippets.init(); }); }); }、 "コードスニペット"); StackExchange.ready(function(){ var channelOptions = { タグ: "" .split( "")、 id: "1" }; initTagRenderer( ""。split( "")、 "" .split( "")、channelOptions); StackExchange.using( "externalEditor"、function(){ //スニペットが有効になっている場合は、スニペットの後にエディターを起動する必要があります if(StackExchange.settings.snippets.snippetsEnabled){ StackExchange.using( "スニペット"、function(){ createEditor(); }); } そうしないと { createEditor(); } }); 関数createEditor(){ StackExchange.prepareEditor({ useStacksEditor:false、 heartbeatType: '回答'、 autoActivateHeartbeat:false、 convertImagesToLinks:true、 noModals:true、 showLowRepImageUploadWarning:true、 レピュテーションToPostImages:10、 bindNavPrevention:true、 後置: ""、 imageUploader:{ brandingHtml: "Powered by \ u003ca href = \" https://imgur.com/ \ "\ u003e \ u003csvg class = \" svg-icon \ "width = \" 50 \ "height = \" 18 \ "viewBox = \ "0 0 50 18 \" fill = \ "none \" xmlns = \ "http://www.w3.org/2000/svg \" \ u003e \ u003cpath d = \ "M46.1709 9.17788C46.1709 8.26454 46.2665 7.94324 47.1084 7.58816C47.4091 7.46349 47.7169 7.36433 48.0099 7.26993C48.9099 6.97997 49.672 6.73443 49.672 5.93063C49.672 5.22043 48.9832 4.61182 48.1414 4.61182C47.4335 4.61182 46.7256 4.91628 46.0943 5.50789C45.7 43.1481 6.59048V11.9512C43.1481 13.2535 43.6264 13.8962 44.6595 13.8962C45.6924 13.8962 46.1709 13.2535 46.1709 11.9512V9.17788Z \ "/ \ u003e \ u003cpath d = \" M32.492 10.1419C32.492 12.6954 34.1182 14.0484 37.0451 14.0484C39.9723 14.0 41.5985 12.6954 41.5985 10.1419V6.59049C41.5985 5.28821 41.1394 4.66232 40.1061 4.66232C39.0732 4.66232 38.5948 5.28821 38.5948 6.59049V9.60062C38.5948 10.8521 38.2696 11.5455 37.0451 11.5455C35.8209 11.5455 35.4954 10.8 521 35.4954 9.60062V6.59049C35.4954 5.28821 35.0173 4.66232 34.0034 4.66232C32.9703 4.66232 32.492 5.28821 32.492 6.59049V10.1419Z \ "/ \ u003e \ u003cpath fill-rule = \" evenodd \ "clip-rule = \" evenodd \ "d = \ "M25.6622 17.6335C27.8049 17.6335 29.3739 16.9402 30.2537 15.6379C30.8468 14.7755 30.9615 13.5579 30.9615 11.9512V6.59049C30.9615 5.28821 30.4833 4.66231 29.4502 4.66231C28.9913 4.66231 28.4555 4.94978 28.1109 5.50789C27.499 .1369 4.56087 21.0134 6.57349 21.0134 9.27932C21.0134 11.9852 23.003 13.913 25.3754 13.913C26.5612 13.913 27.4607 13.4902 28.1109 12.6616C28.1109 12.7229 28.1161 12.7799 28.121 12.8346C28.1256 12.8854 28.1301 12.9342 28.1301 12.983C 15.2321 24.1352 14.9821 23.5661 14.7787C23.176 14.6393 22.8472 14.5218 22.5437 14.5218C21.7977 14.5218 21.2429 15.0123 21.2429 15.6887C21.2429 16.7375 22.9072 17.6335 25.6622 17.6335ZM24.1317 9.27932C24.1317 7.94324 24.9928 7.09766 261024 27.2119 7.09766 28.0918 7.94324 28.0918 9.27932C28.0918 10.6321 27.2311 11.5116 26.1024 11.5116C24.9737 11.5116 24.1317 10.6491 24.1317 9.27932Z \ "/ \ u003e \ u003cpath d = \" M16.8045 11.9512C16.8045 13.2535 17.2637 13.8962 18.296513.8962C19.3298 13.8962 19.8079 13.2535 19.8079 11.9512V8.12928C19.8079 5.82936 18.4879 4.62866 16.4027 4.62866C15.1594 4.62866 14.279 4.98375 13.3609 5.88013C12.653 5.05154 11.6581 4.62866 72866 10.35732866C9.3732 4.66232C5。13.2535 13.9157 13.2535 13.9157 11.9512V8.90741C13.9157 7.58817 14.3365 6.91179 15.4269 6.91179C16.40276.91179u。.316755.288212.83866 4.66232 1.82471 4.66232C0.791758 4.66232 0.313354 5.28821 0.313354 6.59049V11.9512C0.313354 13.2535 0.7 13.25353.316 7511.9512V6。Z\ "fill = \"#1BB76E \ "/ \ u003e \ u003c / svg \ u003e \ u003c / a \ u003e"、 contentPolicyHtml: "\ u003ca href = \" https://stackoverflow.com/help/licensing \ "\ u003ecc by-sa \ u003c / a \ u003e \ u003ca href = \" https://stackoverflow.comでライセンスされたユーザー投稿/リーガル/コンテンツポリシー\ "\ u003e(コンテンツポリシー)\ u003c / a \ u003e"、 allowUrls:true }、 オンデマンド:true、 DiscardSelector: ".discard-answer" 、immediatelyShowMarkdownHelp:true、enableTables:true、enableSnippets:true }); } }); Stack Overflowへの回答を提供していただきありがとうございます! 必ず質問に答えてください。詳細を提供し、あなたの研究を共有してください! しかし避けてください… 助けを求める、説明する、または他の答えに答える。 意見に基づいて発言する。参照または個人的な経験でそれらをバックアップします。 詳細については、優れた回答を書くためのヒントをご覧ください。 ドラフトを保存しました ドラフトは破棄されました サインアップまたはログイン StackExchange.ready(function(){ StackExchange.helpers.onClickDraftSave( '#login-link'); }); Googleを使用してサインアップ Facebookを使用してサインアップ Eメールとパスワードを使用してサインアップ 参加する ゲストとして投稿 名前 Eメール 必須ですが、表示されません StackExchange.ready( 関数 () { StackExchange.openid.initPostLogin( '。new-post-login'、 'https%3a%2f%2fstackoverflow.com%2fquestions%2f54745855%2ftokenize-abstract-terminals-in-ll-grammar%23new-answer'、 'question_page' ); } ); ゲストとして投稿 名前 Eメール 必須ですが、表示されません あなたの答えを投稿してください 破棄 「PostYourAnswer」をクリックすると、利用規約、プライバシーポリシー、Cookieポリシーに同意したことになります。 あなたが探している答えではありませんか? parsing lexer bnf ll recursive-descentとタグ付けされた他の質問を参照するか、独自の質問をしてください。