我目前正在為XML風格編寫基本的解析器。作為練習,我將實現一個LL表驅動的解析器。 這是我的BNF語法示例: %令牌名稱數據字符串 %% / * LL(1)* / doc:elem 元素:“ <” open_tag open_tag:名稱attr close_tag close_tag:“>” elem_or_data“ ” name“>” | “ />” ; elem_or_data:“ <” open_tag elem_or_data |數據elem_or_data | / * epsilon * / ; attr:名稱“:”字符串attr | / * epsilon * / ; 這個語法正確嗎? 每個終端文字都在引號之間。抽象終端由%token指定。 我正在編寫一個手寫詞法分析器,以將輸入內容轉換為令牌列表。我將如何標記抽象終端?
2021-03-03 08:10:15
經典方法是為每個可能的終端編寫一個正則表達式(或其他識別器)。 所謂的“抽象”終端,實際上是非常具體的終端,其關聯的模式可以識別多個可能的輸入字符串。實際識別的字符串(或該字符串的某些計算函數)應作為標記的語義值傳遞給解析器。 名義上,在輸入字符串的每個點上,令牌生成器將運行所有識別器,並選擇匹配時間最長的識別器。 (這是所謂的“最大嚼數”規則。)通常可以對其進行優化,尤其是在所有模式都是正則表達式的情況下。例如,(F)lex將為您進行優化。 您的情況的複雜之處在於,語言的標記化取決於上下文。特別是,當目標是elem_or_data時,唯一可能的標記是<,和“ data”。但是,在標籤內部,“數據”是不可能的,“名稱”和“字符串”標籤是可能的(以及其他)。 屬性的值也可能具有與鍵相同的詞法形式(即名稱)。在XML本身中,屬性值必須是帶引號的字符串,並且使用未帶引號的字符串將被標記為錯誤,但是肯定有“類似於XML”的語言(例如HTML)可以在其中插入不帶空格的屬性值未報價。 由於詞法分析取決於上下文,因此詞法分析器必須傳遞(或訪問)定義詞法上下文的其他信息。通常將其表示為單個枚舉值,可以根據返回的最後幾個標記或基於當前解析器堆棧的FIRST集來計算該枚舉值。 2個 | 你的答案 StackExchange.ifUsing(“ editor”,function(){ StackExchange.using(“ externalEditor”,function(){ StackExchange.using(“ snippets”,function(){ StackExchange.snippets.init(); }); }); },“代碼段”); StackExchange.ready(function(){ var channelOptions = { 標籤:“” .split(“”), id:“ 1” }; initTagRenderer(“”。split(“”),“” .split(“”),channelOptions); StackExchange.using(“ externalEditor”,function(){ //如果啟用了摘要,則必須在摘要後觸發編輯器 如果(StackExchange.settings.snippets.snippetsEnabled){ StackExchange.using(“ snippets”,function(){ createEditor(); }); } 別的 { createEditor(); } }); 函數createEditor(){ StackExchange.prepareEditor({ useStacksEditor:否, heartbeatType:“答案”, autoActivateHeartbeat:否, convertImagesToLinks:是, noModals:是的, showLowRepImageUploadWarning:是的, 聲望:ToPostImages:10, bindNavPrevention:是的, 後綴:“”, imageUploader:{ brandingHtml:“採用\ u003ca href = \“ https://imgur.com/ \” \ u003e \ u003csvg class = \“ svg-icon \” width = \“ 50 \” height = \“ 18 \” viewBox = \“ 0 0 50 18 \” fill = \“ none \” xmlns = \“ http://www.w3.org/2000/svg \” \ u003e \ u003cpath d = \“ M46.1709 9.17788C46.1709 8.26454 46.2665 7.94324 47.1084 7.58816C47.4091 7.46349 47.7169 7.36433 48.0099 7.26993C48.9099 6.97997 49.672 6.73443 49.672 5.93063C49.672 5.22043 48.9832 4.61182 48.1414 4.61182C47.4335 4.61182 46.7256 4.91628 46.0943 5.50789C45.74.5 4.313.6662 4.313.6662 43.1481 6.59048V11.9512C43.1481 13.2535 43.6264 13.8962 44.6595 13.8962C45.6924 13.8962 46.1709 13.2535 46.1709 11.9512V9.17788Z \“ / \ u003e \ u003cpath d = \” M32.492 10.1419C32.492 12.6954 34.1182 14.048437.04.0 14.0484 41.5985 12.6954 41.5985 10.1419V6.59049C41.5985 5.28821 41.1394 4.66232 40.1061 4.66232C39.0732 4.66232 38.5948 5.28821 38.5948 6.59049V9.60062C38.5948 10.8521 38.2696 11.5455 37.0451 11.5455C35.8209 11.5455 35.4954 10.8 521 35.4954 9.60062V6.59049C35.4954 5.28821 35.0173 4.66232 34.0034 4.66232C32.9703 4.66232 32.492 5.28821 32.492 6.59049V10.1419Z \“ / \ u003e \ u003cpath fill-rule = \” evenodd \“ clip-rule = \” evenodd \“ d = \“ M25.6622 17.6335C27.8049 17.6335 29.3739 16.9402 30.2537 15.6379C30.8468 14.7755 30.9615 13.5579 30.9615 11.9512V6.59049C30.9615 5.28821 30.4833 4.66231 29.4502 4.66231C28.9913 4.66231 28.4555 4.94978 28.1109 5.50789C6.72.3 4.56087 .1369 4.56087 21.0134 6.57349 21.0134 9.27932C21.0134 11.9852 23.003 13.913 25.3754 13.913C26.5612 13.913 27.4607 13.4902 28.1109 12.6616C28.1109 12.7229 28.1161 12.7799 28.121 12.8346C28.1256 12.8854 28.1301 12.9342 28.1301 12.983C27.24.8349 15.2321 24.1352 14.9821 23.5661 14.7787C23.176 14.6393 22.8472 14.5218 22.5437 14.5218C21.7977 14.5218 21.2429 15.0123 21.2429 15.6887C21.2429 16.7375 22.9072 17.6335 25.6622 17.6335ZM24.1317 9.27932C24.1317 7.94324 24.9928 7.09766 6.69 27.2119 7.09766 28.0918 7.94324 28.0918 9.27932C28.0918 10.6321 27.2311 11.5116 26.1024 11.5116C24.9737 11.5116 24.1317 10.6491 24.1317 9.27932Z \“ / \ u003e \ u003cpath d = \” M16.8045 11.9512C16.8045 13.2535 17.2637 13.8962 18.296513.8962C19.3298 13.8962 19.8079 13.2535 19.8079 11.9512V8.12928C19.8079 5.82936 18.4879 4.62866 16.4027 4.62866C15.1594 4.62866 14.279 4.98375 13.3609 5.88013C12.653 5.05154 11.6581 4.62866 72866 10.35732866C9.3732 4.66232C5 1 13.2535113.8962 13.9157 13.2535 13.9157 11.9512V8.90741C13.9157 7.58817 14.3365 6.91179 15.4269 6.91179C16.4027 6.91179 u .31675 5.28821 2.83866 4.66232 1.82471 4.66232C0.791758 4.66232 0.313354 5.28821 0.313354 6.59049V11.9512C0.313354 13.2535 0.791758962 1.3.8962 13.2535 3.316 75 11.9512V6。Z \“ fill = \”#1BB76E \“ / \ u003e \ u003c / svg \ u003e \ u003c / a \ u003e”, contentPolicyHtml:“根據\ u003ca href = \許可的用戶貢獻\“ https://stackoverflow.com/help/licensing \” \ u003ecc by-sa \ u003c / a \ u003e \ u003ca href = \“ https://stackoverflow.com /法律/內容政策\“ \ u003e(內容政策)\ u003c / a \ u003e”, allowUrls:是 }, onDemand:是的, dispatchSelector:“。discard-answer” ,立即ShowMarkdownHelp:true,enableTables:true,enableSnippets:true }); } }); 感謝您為Stack Overflow提供答案! 請務必回答問題。提供詳細信息並分享您的研究! 但是要避免... 尋求幫助,澄清或回答其他答案。 根據意見發表聲明;用參考或個人經驗來備份它們。 要了解更多信息,請參閱我們撰寫出色答案的提示。 草稿已保存 草稿丟棄 註冊或登錄 StackExchange.ready(function(){ StackExchange.helpers.onClickDraftSave('#login-link'); }); 使用Google註冊 使用Facebook註冊 使用電子郵件和密碼註冊 提交 以訪客身份發布 姓名 電子郵件 必需,但從未顯示 StackExchange.ready( 功能 () { StackExchange.openid.initPostLogin('.New-post-login','https%3a%2f%2fstackoverflow.com%2fquestions%2f54745855%2ftokenize-abstract-terminals-in-ll-語法%23new-answer','question_page' ); } ); 以訪客身份發布 姓名 電子郵件 必需,但從未顯示 發表您的答案 丟棄 點擊“發布答案”,即表示您同意我們的服務條款,隱私權政策和Cookie政策 不是您要找的答案?瀏覽其他標記為lexer bnf ll recursive-descent解析的問題,或詢問您自己的問題。