分享

使用flex,bison构建简单的json解析器

 wusiqi111 2019-09-02

背景

    闲来无聊,抽空写篇博客对flex,bison这两个小工具进行介绍一下。工具本身的用途我不在此赘述。由于自己曾经做过配置文件的解析的工作,深知其中的艰辛与痛苦。flex,bion的出现,为自己解决这类问题打开了另外一扇门。当然,如果拿flex,bison来解析我用到的这些配置文件,有点小题大做了。所以,这个地方,我选择了解析json文本。选择解析json文本的原因是大家在平时做应用层工作时候肯定会用得到,而且,json文本本身的格式并不是太复杂。

      本文在协作的过程中,最初参考了costaxu的这篇文章(http://my.oschina.net/costaxu/blog/107714)。在此表示感谢。由于是作为探索性的尝试,并没有完全实现对json的解析,以及封装成为可供上层调用的库。但整个框架已经能够应用到实际的项目中。

分词

   分词使用的是flex工具,其脚本如下:(文件名为json.fl)

%{#include "stdio.h"#include "json.tab.h"int yywrap(void)	        //自定义此函数,是应用程序完全脱离对flex库的依赖
{
	return 1;		//返回默认值1
}%}VALUE_INT	   	    [-]?[1-9]+[0-9]*			
VALUE_FLOAT                 [-]?[1-9]+[0-9]\.[0-9]+
VALUE_STRING                [_a-zA-Z]+[_a-zA-Z0-9]+
IGNORE         	            [ \t\r\n]%%\"				return QUOTE;
\,				return COMMA;
\[     			        return BRACE_LEFT; 
\]				return BRACE_RIGHT; 
\{				return BRACEETS_LEFT; 
\}				return BRACEETS_RIGHT; 
\:				return COLON; 
{VALUE_STRING}	yylval = strdup(yytext); return VALUE_STRING;
{VALUE_FLOAT}	return VALUE_FLOAT;
{VALUE_INT}		return VALUE_INT;
{IGNORE}%%

目前,只对三种数据类型,int,float,string类型作了处理,而且string的正则表达式也有待改进。

词法分析

词法分析使用的是bison工具,其内容如下(文件名为json.y)

%{#include <stdio.h>#include <string.h>void yyerror(const char* s)
{	printf("ERROR:%s\n",s);
}int main()
{
	FILE * infp = NULL;
	infp = fopen("config.file","r");
	yyrestart(infp);
	yyparse();
	fclose(infp);	return 0;
}

%}

%token QUOTE COMMA BRACE_LEFT BRACE_RIGHT BRACEETS_LEFT BRACEETS_RIGHT COLON VALUE_STRING VALUE_FLOAT VALUE_INT

%%
root: 
	|
	BRACEETS_LEFT items BRACEETS_RIGHT
	;
	
items: 
	|
	items COMMA item
	|
	item
	;
	
item: 
	item_int
	|
	item_float
	|
	item_string
	|
	item_item
	;
	
item_int: QUOTE VALUE_STRING QUOTE COLON VALUE_INT
	{		printf("Model item_int![Name:%s]\n",$2);
	}
	;
	
item_float: QUOTE VALUE_STRING QUOTE COLON VALUE_FLOAT
	{		printf("Model item_float![Name:%s]\n",$2);
	}
	;
	
item_string: QUOTE VALUE_STRING QUOTE COLON  QUOTE VALUE_STRING QUOTE
	{		printf("Model item_string![Name:%s]\n",$2);
	}
	;
	
roots:
	|
	roots COMMA root
	|
	root
	;
	
item_item: QUOTE VALUE_STRING QUOTE COLON  BRACE_LEFT roots BRACE_RIGHT
	{		printf("Model item_item![Name:%s]\n",$2);
	}
	;

备注,上面仅仅是对json文件进行语法分析,再此仅将json对的名字进行简单的打印。

后记

    依次使用如下命令即可完成对项目的编译工作。

flex json.flbison -d json.ygcc -o lex.exe json.tab.c lex.yy.c
从百度百科拿下一段json文本,如下
{ 
"people": [
                { "firstName": "Brett", "lastName":"McLaughlin", "email": "aaaa" },
                { "firstName": "Jason", "lastName":"Hunter", "email": "bbbb"},
                { "firstName": "Elliotte", "lastName":"Harold", "email": "cccc" }
            ]
}
保存为,bison中所写的config.file文件。

然后,即可对此json文档进行解析。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约