分享

DataSpell 数据挖掘代码编辑器

 大邓的Python 2021-12-02

Dataspell——一个专为数据科学家制作的IDE。一方面,您拥有 Jupyter 以实现最大的交互性,另一方面拥有 PyCharm 作为专业环境。

什么是DataSpell?

Dataspell 是专为数据科学家制作的 IDE(集成开发环境)。它由 Jetbrains ( IntelliJ Idea 和 PyCharm 背后的一家公司)开发,支持所有主要操作系统平台,包括 ARM (M1) Mac。

DataSpell亮点:

  • 原生notebook体验——如果你使用过 Jupyter 会有宾至如归的感觉。
  • 智能代码辅助 - 有点像 Jupyter 和 PyCharm 生了孩子。
  • Markdown 和 JavaScript — 根据需要设置notebook样式并嵌入数据可视化。
  • 交互式外壳 - REPL 控制台 + 语法检查。
  • SQL 数据库支持 — 连接到数据库、直观地检查数据、导入/导出数据等。

打开dataspell,很像PyCharm


创建你的第一个notebook

该过程几乎与任何其他 Jetbrains 产品相同。点击根目录,进入新建——Jupyter Notebook:

我将其命名为 first_notebook.ipynb。

样式是个人喜好的东西,但你不能说设计不是一流的。

在创建笔记本时,您可能已经看到创建 R 脚本和 Markdown 文件的选项。一旦 Python 正常运行,Dataspell 将同时支持 R 和 Julia(来源)。

现在让我们探索基本的 Python 和数据科学库是如何工作的。下图显示了 Numpy 数组和 Pandas DataFrame:

正如预期的那样。我喜欢 Numpy 数组打印为 Pandas 系列的方式,但这只是个人喜好。Matplotlib 呢?这是一个真正简单的散点图:

我更喜欢出版物可视化的白色背景,但在晚上工作时眼睛无法长时间工作,夜晚我喜欢黑色背景。干得好,Dataspell。

接下来,让我们探索每个 IDE 必须具备的功能——智能编码辅助。


智能编码辅助

我不喜欢 JupyterLab 的是缺乏编码帮助。确实有插件,但它们的帮助远不及专业的 IDE。我不喜欢 IDE 的是缺乏交互性。希望 Dataspell 将是两全其美的。

让我们尝试导入 Numpy,看看会发生什么:

支持自动代码提示——它完美无缺;也支持代码未正确编写时的警告/错误,例如函数add_integers 应该返回一个整数,但它故意返回一个浮点数:


支持markdown

首先,将鼠标悬停在单元格上方并单击添加 Markdown 单元格:

另一种方法是单击代码下拉列表并将单元格类型切换为 Markdown。

下面是一些 Markdown 代码供您尝试:

这是运行单元格时的样子:


支持数据库

作为数据科学家,您几乎每天都必须建立和管理数据库连接。当 SQL 写成字符串时,调试很长的 SQL 行并不容易。Dataspell 有一个解决方案。以下是使用 sqlite3 包建立连接、创建数据库和表的方法:

您现在可以像往常一样插入数据:

Dataspell 的特别之处在于无需离开 IDE 或编写不必要的查询即可浏览数据库的选项。只需双击数据库,就会打开一个新的侧窗口。从那里,您可以轻松单击任何感兴趣的表格,在单独的选项卡中浏览它:

近期文章

视频专栏课 | Python网络爬虫与文本分析

如何在DataFrame中使用If-Else条件语句创建新列

BERTopic 主题建模库 | 建议收藏

KeyBERT库 | 自动挖掘文本中的关键词

SmartScraper | 简单、自动、快捷的Python网络爬虫

SHAP | 机器学习模型解释库

读完本文你就了解什么是文本分析

文本分析在经管领域中的应用概述

综述:文本分析在市场营销研究中的应用

在会计研究中使用Python进行文本分析

文本分析方法在《管理世界》(2021.5)中的应用

hiResearch 定义自己的科研首页

SciencePlots | 科研样式绘图库

Wow~70G上市公司定期报告数据集

漂亮~pandas可以无缝衔接Bokeh  

YelpDaset: 酒店管理类数据集10+G

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多