我目前正在为XML风格编写基本的解析器。作为练习,我将实现一个LL表驱动的解析器。 这是我的BNF语法示例: %令牌名称数据字符串 %% / * LL(1)* / doc:elem 元素:“ <” open_tag open_tag:名称attr close_tag close_tag:“>” elem_or_data“ ” name“>” | “ />” ; elem_or_data:“ <” open_tag elem_or_data |数据elem_or_data | / * epsilon * / ; attr:名称“:”字符串attr | / * epsilon * / ; 这个语法正确吗? 每个终端文字都在引号之间。抽象终端由%token指定。 我正在编写一个手写词法器,以将我的输入转换成令牌列表。我将如何标记抽象终端?
2021-03-03 08:10:06
经典方法是为每个可能的终端编写一个正则表达式(或其他识别器)。 您所谓的“抽象”终端,实际上是非常具体的终端,其关联的模式可以识别多个可能的输入字符串。实际识别的字符串(或该字符串的某些计算函数)应作为标记的语义值传递给解析器。 名义上,在输入字符串的每个点上,令牌生成器将运行所有识别器,并选择匹配时间最长的识别器。 (这是所谓的“最大嚼数”规则。)通常可以对其进行优化,尤其是当所有模式都是正则表达式时。例如,(F)lex将为您进行优化。 您的情况的复杂之处在于,语言的标记化取决于上下文。特别是,当目标是elem_or_data时,唯一可能的标记是<,和“ data”。但是,在标签内部,“数据”是不可能的,“名称”和“字符串”标签是可能的(以及其他)。 属性的值也可能具有与键相同的词法形式(即名称)。在XML本身中,属性值必须是带引号的字符串,并且使用未带引号的字符串将被标记为错误,但是肯定有“类似于XML”的语言(例如HTML)可以在其中插入不带空格的属性值没有报价。 由于词法分析取决于上下文,因此词法分析器必须传递(或访问)定义词法上下文的其他信息。通常将其表示为单个枚举值,可以根据返回的最后几个标记或基于当前解析器堆栈的FIRST集来计算该枚举值。 2个 | 你的答案 StackExchange.ifUsing(“ editor”,function(){ StackExchange.using(“ externalEditor”,function(){ StackExchange.using(“ snippets”,function(){ StackExchange.snippets.init(); }); }); },“代码段”); StackExchange.ready(function(){ var channelOptions = { 标签:“” .split(“”), id:“ 1” }; initTagRenderer(“”。split(“”),“” .split(“”),channelOptions); StackExchange.using(“ externalEditor”,function(){ //如果启用了摘要,则必须在摘要后触发编辑器 如果(StackExchange.settings.snippets.snippetsEnabled){ StackExchange.using(“ snippets”,function(){ createEditor(); }); } 别的 { createEditor(); } }); 函数createEditor(){ StackExchange.prepareEditor({ useStacksEditor:否, heartbeatType:“答案”, autoActivateHeartbeat:否, convertImagesToLinks:是, noModals:是的, showLowRepImageUploadWarning:是的, 声望:ToPostImages:10, bindNavPrevention:是的, 后缀:“”, imageUploader:{ brandingHtml:“采用\ u003ca href = \“ https://imgur.com/ \” \ u003e \ u003csvg class = \“ svg-icon \” width = \“ 50 \” height = \“ 18 \” viewBox = \“ 0 0 50 18 \” fill = \“ none \” xmlns = \“ http://www.w3.org/2000/svg \” \ u003e \ u003cpath d = \“ M46.1709 9.17788C46.1709 8.26454 46.2665 7.94324 47.1084 7.58816C47.4091 7.46349 47.7169 7.36433 48.0099 7.26993C48.9099 6.97997 49.672 6.73443 49.672 5.93063C49.672 5.22043 48.9832 4.61182 48.1414 4.61182C47.4335 4.61182 46.7256 4.91628 46.0943 5.50789C45.74.5 4.313.6662 4.313.6662 43.1481 6.59048V11.9512C43.1481 13.2535 43.6264 13.8962 44.6595 13.8962C45.6924 13.8962 46.1709 13.2535 46.1709 11.9512V9.17788Z \“ / \ u003e \ u003cpath d = \” M32.492 10.1419C32.492 12.6954 34.1182 14.048437.04.0 14.0484 41.5985 12.6954 41.5985 10.1419V6.59049C41.5985 5.28821 41.1394 4.66232 40.1061 4.66232C39.0732 4.66232 38.5948 5.28821 38.5948 6.59049V9.60062C38.5948 10.8521 38.2696 11.5455 37.0451 11.5455C35.8209 11.5455 35.4954 10.8 521 35.4954 9.60062V6.59049C35.4954 5.28821 35.0173 4.66232 34.0034 4.66232C32.9703 4.66232 32.492 5.28821 32.492 6.59049V10.1419Z \“ / \ u003e \ u003cpath fill-rule = \” evenodd \“ clip-rule =” \ evenodd \“ d = \“ M25.6622 17.6335C27.8049 17.6335 29.3739 16.9402 30.2537 15.6379C30.8468 14.7755 30.9615 13.5579 30.9615 11.9512V6.59049C30.9615 5.28821 30.4833 4.66231 29.4502 4.66231C28.9913 4.66231 28.4555 4.94978 28.1109 5.50789C6.723 4.5608.787 .1369 4.56087 21.0134 6.57349 21.0134 9.27932C21.0134 11.9852 23.003 13.913 25.3754 13.913C26.5612 13.913 27.4607 13.4902 28.1109 12.6616C28.1109 12.7229 28.1161 12.7799 28.121 12.8346C28.1256 12.8854 28.1301 12.9342 28.1301 12.983C27.24.8349 15.2321 24.1352 14.9821 23.5661 14.7787C23.176 14.6393 22.8472 14.5218 22.5437 14.5218C21.7977 14.5218 21.2429 15.0123 21.2429 15.6887C21.2429 16.7375 22.9072 17.6335 25.6622 17.6335ZM24.1317 9.27932C24.1317 7.94324 24.9928 7.09766 26.1024 27.2119 7.09766 28.0918 7.94324 28.0918 9.27932C28.0918 10.6321 27.2311 11.5116 26.1024 11.5116C24.9737 11.5116 24.1317 10.6491 24.1317 9.27932Z \“ / \ u003e \ u003cpath d = \” M16.8045 11.9512C16.8045 13.2535 17.2637 13.8962 18.296513.8962C19.3298 13.8962 19.8079 13.2535 19.8079 11.9512V8.12928C19.8079 5.82936 18.4879 4.62866 16.4027 4.62866 4.62866C15.1594 14.279 4.98375 13.3609 5.05154 5.88013C12.653 11.6581 4.62866 72866 10.35732866C9.3732 4.66232C5.47873 4.66232 5.00066 5.28821 5.00066 6.59049V11.9512C5 。13.2535 11.3711 13.8962 12.4044 13.8962 13.8962C13.4375 13.9157 13.2535 13.9157 11.9512V8.90741C13.9157 7.58817 14.3365 6.91179 15.4269 6.91179C16.4027 6.91179 16.8045 7.58817 16.8045 8.94108V11.9512Z \ “/ \ u003e \ u003cpath d = \” M3.31675 6.59049 C3 0.31675 5.28821 2.83866 4.66232 1.82471 4.66232 4.66232C0.791758 0.313354 5.28821 0.313354 6.59049V11.9512C0.313354 13.2535 0.791758 13.8962 1.82471 13.8962C2.85798 13.8962 3.31675 13.2535 3.316 75 11.9512V6。ž\ “填充” #1BB76E \ = \ “/ \ u003e \ u003c / SVG \ u003e \ u003c / A \ u003e”, contentPolicyHtml://stackoverflow.com/help/licensing \ “\ u003ecc BY-SA \ u003c / A \ u003e \ u003ca HREF = \” https://stackoverflow.com:HTTPS “用户贡献\ u003ca HREF = \下许可” /法律/内容政策\“ \ u003e(内容政策)\ u003c / a \ u003e”, allowUrls:真 }, onDemand:是的, discardSelector: “.discard回答” ,immediatelyShowMarkdownHelp:真,enableTables:真,enableSnippets:真 }); } }); 感谢您提供的答案,堆栈溢出! 请务必回答这个问题。提供详细资料和分享您的研究! 但要避免... 寻求帮助,澄清或回答其他答案。 根据意见作出说明;对它们进行备份与引用或个人经验。 要了解更多信息,请参阅我们撰写出色答案的提示。 草稿已保存 丢弃草案 注册或登录 StackExchange.ready(function(){ StackExchange.helpers.onClickDraftSave('#login-link'); }); 注册使用谷歌 注册使用Facebook的 注册使用的电子邮件和密码 提交 以访客身份发布 姓名 电子邮件 必需,但从未显示 StackExchange.ready( 功能 () { StackExchange.openid.initPostLogin('.New-post-login','https%3a%2f%2fstackoverflow.com%2fquestions%2f54745855%2ftokenize-abstract-terminals-in-ll-gram %% 23new-answer','question_page' ); } ); 以访客身份发布 姓名 电子邮件 必需,但从未显示 发布您的答案 丢弃 点击“发表你的答案”,你同意我们的服务,隐私政策和cookie策略方面 不是您要找的答案?浏览其他标记为lexer bnf ll recursive-descent解析的问题,或询问您自己的问题。