在如何使用python脚本转换数据和命令行中,我们将深入讨论如何使用python脚本和命令行转换数据。
但是首先,有必要问一个你可能正在思考的问题python如何适应命令行?当我知道我可以用我的ipython笔记本完成所有的数据科学工作时,我为什么要使用命令行来与python交互呢?"还是朱庇特实验室?"
笔记本非常适合快速进行数据可视化和探索,但python脚本是一种将我们所学投入生产的。假设你想建立一个网站,帮助人们发布黑客新闻帖子,有理想的标题和提交时间。为此,您需要一个脚本。
本教程假设您对函数有基本的了解,并且有一点命令行经验不会有什么坏处。如果您以前从未使用过python,请随时查看我们涵盖python函数基础的任务,或者更深入地学习我们的一些数据科学课程。最近,我们发布了两个新的交互式命令行课程:"命令行元素和和"命令行和程序中的文本处理,所以如果你想更深入的学习命令行,我们也推荐你。
换句话说,唐不要太担心先决条件!我们会解释我们正在做的一切,所以让我们让我们开始吧!
熟悉数据
黑客新闻是一个网站,用户可以通过互联网提交文章(通常是关于技术和创业),其他人可以"赞美与赞美这些文章来表明他们喜欢它们。提交的投票越多,他们在社区中就越受欢迎。热门文章进入"主页和黑客新闻,他们更有可能被其他人在其他网站上看到。
我们将使用的数据集是arnauddrizard使用黑客新闻api编译的,可以在这里找到。我们从数据中随机抽取了10000行,删除了所有多余的列。我们的数据集只有四列:
submission_time——故事提交的时间。
upvotes-提交的投票数。
url—提交的基本域。
标题--提交的标题。用户可以在不匹配原文章标题的情况下进行编辑。
我们将编写脚本来回答三个关键问题:
什么新闻最常出现在头条?
哪些域名最常提交给黑客新闻?
大部分文章什么时候提交?
记住:编程的时候,处理任务的方法有很多种。在本教程中,我们将逐步解决这些问题,但肯定有其他方法同样有效,所以请随时尝试并提出自己的方法!
使用命令行和pyth在脚本上读取数据
要添加星星,让stransform_data_with_python在桌面上创建文件夹。要使用命令行创建文件夹,可以使用mkdir命令,后跟文件夹名称。例如,如果要创建一个名为test的文件夹,可以导航到桌面目录并键入mkdirtest。
我们稍后将讨论为什么创建这个文件夹,但是现在,让使用cd命令导航到创建的文件夹。这个cd命令允许我们使用命令行来更改目录。
虽然使用命令行创建文件有很多方法,但是我们可以使用一种称为管道传输和重定向输出的技术来同时做两件事:将stdout的输出(命令行生成的标准输出)重定向到一个文件,并创建一个新文件!换句话说,我们可以让它创建一个新文件,并将其输出作为文件的内容,而不是让命令行只打印其输出。
为此,我们可以使用gt和gtgt,这取决于我们想对文件做什么。如果文件不存在,两者都会创建一个文件。但是,gt会用重定向的输出覆盖文件中的现有文本,并且gtgt会将任何重定向的输出附加到文件中。
我们希望将数据读入这个文件,并创建一个描述性的文件名和函数名,因此我们将创建一个名为load_data()的函数,并将其保存在一个名为。让让我们使用读取数据的命令行创建一个函数。为此,我们将使用printf函数。我们将使用printf,因为它允许我们打印换行符和制表符,我们将使用它们来使脚本对我们自己和他人更具可读性。
为此,我们可以在命令行上输入以下内容。
打印函数
作为一种动态语言,python实际上是一个解释器软件包。当python运行一个脚本时,python会在代码开始处理之前执行一些步骤。
第一步是编译成所谓的"字节码和。如果python进程有写权限,程序的字节码会保存为一个文件,扩展名为。pyc。如果python不能在机器上编写字节码,程序仍然可以工作:字节码将在内存中生成,并在程序结束时被简单地丢弃。