当我们在使用Flask时，如何记录日志

刮骨剑 2019-06-26

展开全文

0.2 2017.01.24 18:47* 字数 3885

我们在开发基于Flask的Web应用时，往往容易忽略了对日志的使用，而在Flask的官方文档中，对日志这块的介绍也仅仅停留在如何与系统集成上。记录日志这个看似很简单的事情，在实际中很多人却不一定能做好，要么不知道何时进行日志记录，要么就是记录的日志然并卵。所以，今天就来说说记录日志这件小事。

说它是件小事，因为它的确不会影响你系统的正常流程，有没有它系统都能跑起来，也正因为这样，很多人便忽略了日志的处理，或者干脆都没有配置日志输出，整个系统没有任何日志输出（Nginx日志不算）。当然，如果是我们自己开发的一些小网站，大家用来练练手或着用户量不大，有没有日志都一样，但是对于一些大型的系统，它的用户是很多的，在任何一个环节都可能出问题，为了能够及时的定位问题和监控系统运行状态，正确合理的记录日志就非常非常重要了。一般情况下，我们需要关注的是三个方面的内容：

日志信息的集中采集、存储和检索：这个主要是在多节点的情况下如何方便的查看日志信息。
日志信息的输出策略：要保证日志输出的全面而又不显凌乱，方便开发人员跟踪和分析问题。
关键业务的日志输出：我们常说的打点就属于这个范畴，比如我们的一些浏览记录等，这个就需要根据业务要求来做针对性设计了。

我们在这里主要是围绕第二个问题来展开，也是我们开发人员最直接接触的情况。

日志输出级别

从Flask 0.3 版本开始，系统就已经帮我们预配置了一个logger，而这个logger的使用也是非常简单：

app.logger.debug('A value for debugging')
app.logger.warning('A warning occurred (%d apples)', 42)
app.logger.error('An error occurred')

其中的app就是Flask的实例，而这个app.logger也就是一个标准的logging Logger，因此，我们在使用app.logger时可选择的输出级别与python logging中的定义是一致的。

ERROR：这个级别的日志意味着系统中发生了非常严重的问题，必须有人马上处理，比如数据库不可用了，系统的关键业务流程走不下去了等等。很多人在实际开发的时候，不会去区分问题的重要程度，只要有问题就error记录下来，其实这样是非常不负责任的，因为对于成熟的系统，都会有一套完整的报错机制，那这个错误信息什么时候需要发出来，很多都是依据单位时间内error日志的数量来确定的。因此如果我们不分轻重缓急，一律error对待，就会徒增报错的频率，久而久之，我们的救火队员对错误警报就不会那么在意，这个警报也就失去了原始的意义。
WARN：发生这个级别的问题时，处理过程可以继续，但必须要对这个问题给予额外的关注。假设我们现在有一个系统，希望用户每一个月更换一次密码，而到期后，如果用户没有更新密码我们还要让用户可以继续登录，这种情况下，我们在记录日志时就需要使用WARN级别了，也就是允许这种情况存在，但必须及时做跟踪检查。
INFO：这个级别的日志我们用的也是比较多，它一般的使用场景是重要的业务处理已经结束，我们通过这些INFO级别的日志信息，可以很快的了解应用正在做什么。我们以在12306上买火车票为例，对每一张票对应一个INFO信息描述“[who] booked ticket from [where] to [where]”。
DEBUG和TRACE：我们把这两个级别放在一起说，是应为这两个级别的日志是只限于开发人员使用的，用来在开发过程中进行调试，但是其实我们有时候很难将DEBUG和TRACE区分开来，一般情况下，我们使用DEBUG足以。

以上就是我们实际开发中最多接触的几种日志级别，基本能覆盖99%的情况。最后我们要注意的就是，最好能尽可能输出更多的日志信息，并且不做任何过滤，同时输出的每一条日志的详细信息要切当，让我们可以快速过滤并找到所需的信息。

日志输出信息

当我们确定了使用哪个级别来写入日志后，下一步要做的就是确定要记录什么样的信息。针对这一块的内容，其实又可以细分。

日志应该记录什么

一般来说，日志的记录要满足几个要求：可读、干净、详细和自描述。我们先来看几个反模式的例子：

app.logger.debug('message processed')
app.logger.debug(message.get_message_id())
app.logger.debug('message with id %s', message.get_message_id())

if isinstance(message, TextMessage):
    ...else:
    app.logger.warn('unknow message type')

上面列出的这几个例子，问题在什么地方呢？当看到这些日志信息后，我们首先意识到的肯定是哪里出了问题，但是，这个问题产生的原因是什么我们并不清楚，也就是说，只根据这样的日志我们是没办法对问题进行修复的。所以我们在记录日志的时候，应该要尽量的详细，日志的上下文要交代清楚。

另外一种反模式的日志信息，我们通常叫做魔法日志。就比如说，有的开发人员为了自己查找信息方便，会输出一些类似&&&###>>>>>>的日志，这些特殊的符号只有开发者本人清楚到底是做什么的，而对其他人来说，看到这些日志绝对是一脸懵逼。即使是开发者本人，哪怕当时能够清楚这些魔法日志的特殊含义，但时间一长，估计他们也很难回想起当时为啥要输出这些鬼东西了吧。

其次，还有一种是要关注外部系统，也就是在和任何外部系统通信的时候，建议记录所有进出系统的数据。但是，记录这些信息时，性能是一个比较头痛的问题，有时，需要和外部系统交换的信息量太大，导致无法记录所有信息。但是，在调试或测试期间我们还是愿意记录所有信息，并准备为此付出一些性能的代价，这个可以通过仔细控制log级别来实现，比如：

if app.config['debug']:
    app.logger.debug('...')else:
    app.logger.info('...')

最后要提的一点就是，我们输出的这些日志信息中，绝对不可以透露系统密码和一些个人信息。

如何打印日志内容

当我们明确了该用哪个级别去记录哪些信息后，就要把这些信息输出到日志文件中，但是想正确高效的打印日志内容也并非一件简单的事。Flask已经帮我们预配置了一个logger，我们可以使用这个logger来完成我们所有的打印操作。

我们在记录日志的时候绝对不可以使用print，即使我们在开发调试的时候能够在控制台看到打印的信息，但是这样的信息并不会记录到日志文件中，当我们的程序上线后，跟没有记录日志的效果是一样的。因此，哪怕是在开发调试时，也要尽量使用logger。

最简单的日志打印就是输出一个字符串，比如像下面这样

app.logger.info('this is a string')

但大部分时候，我们要记录的信息都会包含一些参数，有一种实现方式是提前构造出这个字符串

message_info = 'the message is %s' % info
app.logger.info(message_info)

这种写法也没啥问题，但其实，logger内部也可以帮助我们完成上面的操作，也就是我们还可以写成下面这样

app.logger.info('the message if %s', info)

这样看起来是不是简洁了好多呢？

记录异常信息

记录异常信息严格来说也应该算到日志输出的范畴，之所以把它拿出来单独说，是因为除了说明应该怎样去记录异常外，这里还要说下如何去自定义异常。

正确的记录异常信息

对于异常，我们更想看到的其实是它的堆栈信息，而不是简单的一句话，堆栈信息可以帮助我们快速的定位问题出处。如果想打印堆栈，我们前面的记录方法就不再实用了，哪怕我们把Exception的实例丢到logger里打印出来的也仅仅是错误信息而不是堆栈信息。比如下面的例子

a = [1, 2, 3]try:print a[3]
except Exception, e:
    logging.error(e)

如果我们查看日志，发现打印出的仅仅是一行错误信息：

Tue, 24 Jan 2017 16:07:20 demo.py[line:22] ERROR list index out of range

那如何打印出堆栈信息呢？python给我们提供了一个exception方法，它的使用跟debug、info、warn、error几个方法是一样的，我们可以把上面的代码修改一下

a = [1, 2, 3]try:print a[3]
except Exception, e:
    logging.exception(e)

之后我们再看日志输出

Tue, 24 Jan 2017 17:19:37 demo.py[line:22] ERROR list index out of range
Traceback (most recent call last):
  File "/Users/xiaoz/developments/python/ttest/demo.py", line 20, in testprint a[3]
IndexError: list index out of range

除了我们上面使用error方法打印的错误信息外，还打印出了出错的堆栈信息，由此看见，exception方法打印的日志会包含两项，第一项就是调用exception方法时传入的message，还有一项是紧跟在message后面的堆栈信息。

当我们使用exception方法时，它记录的日志级别为ERROR，如果我们希望打印出堆栈信息，同时又不希望使用ERROR这个级别怎么办呢？如果你查看exception方法的实现，会发现，它只是多加了一行代码kwargs['exc_info'] = 1，然后调用了error方法，以此类推，如果我们希望打印堆栈信息就可以像下面这样写：app.logger.info('message info is %s', message, exc_info=1)。

Flask允许我们自定义对异常的处理，一般情况下，我们会做一些统一处理，比如下面这样

@app.errorhandler(500)def internal_server_error(e):app.logger.exception('error 500: %s', e)
    response = json_error('internal server error')
    response.status_code = 500return response

我们在返回结果的同时，对错误信息进行了记录，这样做也是为了避免模板代码，减少开发人员的工作量。但是，在减少我们开发量的同时，这也意味着可能会带来另外一个问题，很多程序员喜欢捕获异常后将错误写入日志，然后再将异常包装后重新抛出，这样会重复打印日志信息：

... some thing ...try:
    ... do some thing ...except Exception, e:
    app.logger.error(e)raise SomeException(e)

还有一种情况，如果我们在捕获异常的时候，不分情况统一捕获Exception也是不对的。直接捕获Exception固然方便，但是我们捕获的范围太大的话，有的时候会吃掉关键的信息，而这些被吃掉的异常又没有打印错误信息和堆栈，一旦有问题，是很难排查的，比如我们定义了下面的方法

def some_method():.. do some thing ..try:
        .. do dome thing 2 ..return Trueexcept Exception, e:return False

当do some thing 2中发生异常时，我们是没法察觉到的，这样不但会使方法返回不正确，也会给排查带来困难。

自定义异常

首先，我们看看为什么要自定义异常，在需要抛出异常的地方，我们直接raise Exception()不好吗？答案很显然，肯定是不好，具体的原因，我们下面就逐条分析下。

大多时候我们都是使用json来为不同端提供接口支持，不管成功与否，都必须使用统一的数据格式。如果系统充斥着各种异常就很难做到统一。
要能反映出该异常的重要程度，比如：如果是参数校验异常则被认为不是很重要，可能直接记下warn日志就行了，而orm异常必须要记录error日志。
最后，对于异常的信息要有区分，比如，对于orm异常，我们希望给用户看到的是一条简单的系统出错的提示信息，而我们在查看日志时必须要有详细的异常信息。

为了解决上面的问题，需要我们来自定义异常，并且使用的时候也尽量要使用已定义的异常类。这里我们来看一种实现方式，大家可以参考

class BaseError(Exception):default_status_code = 200LEVEL_DEBUG = 0LEVEL_INFO = 1LEVEL_WARN = 2LEVEL_ERROR = 3def __init__(self, message, status_code=None, extras=None, parent_error=None):self._message = messageself._code = status_codeself.extras = extrasself.parent_error = parent_errorself.level = BaseError.LEVEL_DEBUG

    @propertydef status_code(self):if not self._code:return BaseError.default_status_codereturn self._codedef to_dict(self):
        rv = {'error_message': self._message,'status_code': self.status_code,'success': False
        }return rvclass ValidationError(BaseError):def __init__(self, message, extras=None):super(ValidationError, self).__init__(message=message, extras=extras)self.level = BaseError.LEVEL_INFOclass NotFoundError(BaseError):def __init__(self, message, extras=None):super(NotFoundError, self).__init__(message=message, extras=extras)self.level = BaseError.LEVEL_WARNclass FormError(BaseError):def __init__(self, form):
        message = form.get_validate_error()super(FormError, self).__init__(message, extras=form.data)self.level = BaseError.LEVEL_INFOclass OrmError(BaseError):def __init__(self, message, status_code=None, extras=None, parent_error=None):super(OrmError, self).__init__(message, status_code, extras, parent_error)self.level = BaseError.LEVEL_ERROR

定义了上面的异常信息后，我们在统一处理错误信息的时候就可以像下面这样实现：

@app.errorhandler(BaseError)def custom_error_handler(e):if e.level in [BaseError.LEVEL_WARN, BaseError.LEVEL_ERROR]:if isinstance(e, OrmError):
            app.logger.exception('%s %s' % (e.parent_error, e))else:
            app.logger.exception('错误信息: %s %s' % (e.extras, e))
    response = jsonify(e.to_dict())
    response.status_code = e.status_codereturn response

如此，就兼顾了日志的错误级别和接口返回的数据格式。

我们还应该注意什么

其实，对于日志的记录，我们前面七七八八也讲了个差不多，在开发的时候如果我们能够注意到上面提到的一些问题，已经能够算是比较合格的打日志了。当然，还有一些小的问题，在最后还是要说明一下。

第一个，就是需要我们关键一下性能问题，也就是避免因为日志拖慢应用系统。如果输出的日志信息太多，必然会增加磁盘的写入负担，通常情况下，每小时输出到磁盘的数据量达到几百M就已经是上限了。

第二个，就是不要由于log语句导致业务过程中断。我们的本意是通过日志来记录系统的一些运行信息，但是，log语句本身也是有可能发生异常的，如果因为我们的代码，导致日志记录的时候抛出了异常，就真的是得不偿失了。

OK，关于在Flask系统中如何进行日志记录，就介绍到这了，其实，上面提到的内容不仅在Flask系统中可行，基本上所有的Web系统都有参考价值。大家有什么问题，欢迎交流。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：刮骨剑 > 《flask》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

刮骨剑

关注对话

TA的最新馆藏

[转] C#.net VSTO Excel开发中一些常用方法
[转] DevExpress ToolTip示例
[转] VB关于webbrowser相关操作大全
[转] 使用VBA操作文件(4):FileSystemObject对象
[转] VB.NET连接SQLite数据库的方法
[转] 神秘园全集13张CD

喜欢该文的人也喜欢更多

热门阅读换一换