什么是tensorflow?tensorflow如何读取csv文件?
扫描二维码
随时随地手机看文章
tensorflow是目前流行框架之一,本文中,小编将对tensorflow的基本内容予以介绍,如什么是tensorflow以及什么是数据流图。此外,本文还将对tensorflow读取csv文件的过程予以解读,并给出具体代码。如果你对tensorflow具有兴趣,不妨一起来了解下。
一、tensorflow介绍
(一) TensorFlow是什么
TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。
Tensorflow是谷歌公司在2015年9月开源的一个深度学习框架。
(二)数据流图是什么
数据流图用“结点”(nodes)和“线”(edges)的有向图来描述数学计算。“节点” 一般用来表示施加的数学操作,但也可以表示数据输入(feed in)的起点/输出(push out)的终点,或者是读取/写入持久变量(persistent variable)的终点。“线”表示“节点”之间的输入/输出关系。这些数据“线”可以输运“size可动态调整”的多维数据数组,即“张量”(tensor)。张量从图中流过的直观图像是这个工具取名为“Tensorflow”的原因。一旦输入端的所有张量准备好,节点将被分配到各种计算设备完成异步
二、TensorFlow读取csv文件过程
本节将采用哈里森和鲁宾菲尔德于 1978 年收集的波士顿房价数据集,数据集相关内容,大家可以百度自行了解。
导入所需的模块并声明全局变量:
1. 定义一个将文件名作为参数的函数,并返回大小等于 BATCH_SIZE 的张量:
2. 定义 f_queue 和 reader 为文件名:
3. 这里指定要使用的数据以防数据丢失。对 .csv 解码并选择需要的特征。例如,选择 RM、PTRATIO 和 LSTAT 特征:
4. 定义参数来生成批并使用 tf.train.shuffle_batch() 来随机重新排列张量。该函数返回张量 feature_batch 和 label_batch:
5. 这里定义了另一个函数在会话中生成批:
6. 使用这两个函数得到批中的数据。这里,仅打印数据;在学习训练时,将在这里执行优化步骤:
TensorFlow csv数据预处理
用前面章节提到的 TensorFlow 控制操作和张量来对数据进行预处理。例如,对于波士顿房价的情况,大约有 16 个数据行的 MEDV 是 50.0。在大多数情况下,这些数据点包含缺失或删减的值,因此建议不要考虑用这些数据训练。可以使用下面的代码在训练数据集中删除它们:
以上便是此次小编带来的“tensorflow”相关内容,通过本文,希望大家对tensorflow读取csv文件的过程具备一定的了解。如果你喜欢本文,不妨持续关注我们网站哦,小编将于后期带来更多精彩内容。最后,十分感谢大家的阅读,have a nice day!