参考文献:
2003_刘挺_怎样做研究.pdf
2006_Duane_Letter-to-research
2006_Duane_Letter-to-research-student.pdf Reading是基本: 1、 寻找和阅读相关基础是研究的起点,要清楚相关工作的参考文献、书目,及未来读物 2、 保持阅读。每个月花时间跟踪阅读本领域中重要的期刊。会议能够及时反映最新研究进展和结论 3、 带着目的阅读,思考回答以下问题 a) 该研究的贡献是什么? b) 该成果是如何解决前人研究中遇到的问题的? c) 论文中有哪些重要的引用文献? 4、 为与自己研究有关系的每篇论文写小结,为本人和他人的研究持续的总结,是经常工作,有助于步步为营找到相关资料 5、 优秀论文阅读完成后,花心思学习它的表达方式 a) 什么使得文章易于阅读? b) 论文提供了何种层次的细节? c) 证明重要概念时,引用了哪些例子? d) 还有哪些问题没有回答? e) 文章的结论可否一般化? 6、 为哪些真正优秀的论文,做标示,从实例中学习,效果更好 7、 与感兴趣的同事一起阅读,有助于加深理解,特别是难懂的技术文献 Writing是基本: 1、 良好的写作是科学过程的最终保存形式。 2、 要尽可能早得撰写自己的研究结论。 3、 简单朴实的写作,往往是成功的。 4、 学习本领域优秀论文的写作,模仿,并努力提高自己的写作能力 5、 科研人员撰写研究日志非常重要,内容应该包括,参考文献、思考的疑问、描述问题及解决方案,试验的数据和研究结论。 6、 相关文献阅读后,撰写总结。 7、 必须每天保留固定的时间进行写作,这个过程是“考虑问题”的过程 与他人一起工作: 1、 许多成功来自于合作,与他人分享思想,并在团体的氛围中继续扩展。 2、 定期会议、讨论。让自己在学术组织中沉浸,即使仿佛没有什么可讨论的。 3、 会议可以同步大家的关注,重新调整问题的重要焦点。 4、 认真对待批评。 讨论不“廉价”: 1、 结构良好的讨论,练习好好准备,有利于发现“意想不到的问题” 项目: 1、 计算机科学的研究中往往涉及项目和编程,记住,编程不是计算机科学研究,往往只是完成试验的一种机制,既然是实验,就需要精心设计并提前计划: a) 确立目标 b) 想简单些:大项目未必产生大的成果 c) 创建原型:多数项目会从原型构建中获益 d) 利用工具:程序员的成绩会通过使用简单工具而得到显著提升 e) 合作:与别人分享成果,自己考虑的问题或许别人已经解决了;但要注意版本控制 f) 文档化结论: 如何选题: 1) 真实课题 2) 相关扩展(NLP->IR,NLP->生物计算) 3) 未知空间不能太小(如手写输入) 4) 不能太难,毕竟有时间限制(如机器翻译、自动校对) 5) 竞争对手不能太多(如语音识别) 课题的价值: 1)意义 影响面(影响的领域、语言、人数) 影响的持续时间 2)创新 新领域、新方向、新理论、新方法、新应用、新语言 (影响力递减 ) 识别课题的性质: 研究项目,还是开发项目 基础研究课题,还是应用研究课题 单一学科课题,还是交叉学科课题 长期课题,还是短期课题 课题必须具备的特征: 有足够的兴趣 能成为世界第一 能赚钱 研究的程序: 对于资历较浅的学者可以:预测可能成为热点一个题目,提前研究 了解背景 多读,注重量的积累 有选择地读 理解文章的动机 找到文章的关键之处 批判性阅读,找出文章中的不足 学习怎样写好文章 Thinking 1)创新至上,“不创新,毋宁死” 重复别人的工作,不如不做 独立思维,表现独特的自我 2)发散思维 创新源于结合(嫁接、类比) (如,仿生学、网格计算(Grid Computing)-网格概念从电力系统引入、功夫在诗外-张旭的草书从公孙大娘的剑舞中悟出) 弄清问题 初始状态是什么 目标状态是什么 如果初始状态和目标状态模糊则不构成一个课题 (如,受限领域语音翻译(订票) —— 特定场景+功能性) 抽象 * 选择数学模型 (如,从Bigram到Dependency Tree) * 设计参数训练的方法 分析与综合: 分析=分类+考察每一类的特性 分析帮助我们看清问题的每一个细节 综合是尽可能地找出统一的模型概括各类现象 分析决定深度,综合决定高度 深入分析: Programming 1)知止 先做数据,人工标注(可以用机器辅助) 再将数据拆分成训练集和测试集两部分 做评测程序 2)亲自动手 观察数据,积累直觉经验 熟练的编程,只有想不到的,没有做不到的 发现问题 3)积累工具 Writing 中国学者最不重视的环节 心中要有读者模型 * 不是日记,不是内心独白 销售你的研究成果 * 我有一个发现,想要告诉你 * Do you like to hear the story? 在写作中提高 永载史册 好论文什么样: 最重要的是逻辑,要丝丝入扣 以最快的速度抓住读者的注意力 * 你解决了什么问题 * 为什么这个问题很重要 * 你的方法如何,和别人的方法有什么区别 * 为什么你的方法有效 完整的论文 * 给出你的假设条件 * 对错误进行分析 * 说出你的方法的局限性 如何评价研究结果: 可重复性 * 规律:放之四海而皆准 * 方法:屡试不爽 大规模测试 真实数据测试 研究与工程的统一 在国际标准测试集上运行你的算法 |
|