机器学习使用tokenizer.fit_on_texts报‘float‘ object has no attribute ‘lower‘错解决办法

news/2024/7/4 8:39:47

机器学习使用tokenizer.fit_on_texts报'float' object has no attribute 'lower'错解决办法

最近在学习机器。在学习过程中使用kaggle中的Womens Clothing E-Commerce Reviews.csv数据集,用Keras分词器Tokenizer,使用tokenizer.fit_on_texts生成词典报'float' object has no attribute 'lower' 错。

from keras.preprocessing.text import Tokenizer 
X_train_lst = df_train["Review Text"] 
y_train = df_train["Rating"].values 
dictionary_size = 20000 
tokenizer = Tokenizer(num_words=dictionary_size) 
tokenizer.fit_on_texts( X_train_lst) 
X_train_tokenized_lst = tokenizer.texts_to_sequences(X_train_lst)

在这里插入图片描述

分析原因:是数据集中"Review Text"中存在字段为空的情况,pandas导入的时候自动转成NaN了,所以报没有lower的属性的错误。

解决方法:增加fillna函数转换将NaN转成空字符串。

X_train_lst = df_train["Review Text"].fillna("")

http://www.niftyadmin.cn/n/595142.html

相关文章

一起撸个微信图片浏览的BaseActivity吧(上)——初步思考与基础结构

本项目git: https://github.com/razerdp/ZoomViewActivity 【下篇】一起撸个微信图片浏览的BaseActivity吧(下)——过渡动画的实现 项目预览图: 距离上次更新博客有两三个月了。。。。太懒了orz... 在微信的日常使用中,我们点击图…

认识SOAR-安全事件编排自动化响应

SOAR是最近几年安全市场上最火热的词汇之一。SOAR究竟是什么,发展历程是什么,能够起什么作用,带着这些问题我们来认识一下SOAR。 一、SOAR是什么 SOAR 一词来自分析机构 Gartner,SOAR-Security Orchestration, Automation and R…

matlab 创建批量文件夹_PS批量处理图片技巧!

当我们在工作中,如果有上百张图片,一张一张处理估计一天时间也不够,那么怎么批量处理图片呢,比如批量压图、批量加个人水印等问题。于是写下我批量处理照片的方法与大家分享。现在,让我们搞起来!一&#xf…

在power query中连接mysql_Power Query 建立数据连接的6种常用方式

Power Query有5大类40种的连接方式,可以连接文件、数据库、在线服务等等各种数据源。今天我们介绍6种常用的连接方式:自文件中的3种:从工作簿从文本/CSV从文件夹从其他源中的3种:自表格区域自网络空白查询从工作簿建立连接&#x…

树莓派python开发_树莓派 Raspberry Pi 编写Python的Hello world!

树莓派 Raspberry Pi 编写Python的Hello world!版权声明:本文为博主原创文章,未经博主允许不得转载。2019年3月16日发布本文介绍在树莓派中如何编写python程序。树莓派通电开机,使用SSH登陆。查看Python的版本我们输入命令&#x…

mysql复选框_前端框架(二)DIV多选复选框框的封装和MySql数据库存取

图能够包括的寓意和含义是文字不能比拟的,先有一个效果图你也就知道这篇文章的主要内容是关于什么问题的。省去了一大堆文字的累述。看以下这张图:这个需求就是要实现某个人具有第二种特性。具有多对多关系。比方某个人既喜欢运动、有喜欢上网等等。这样…

[阅读笔记]fsnotify源码阅读

fsnotify的github地址是https://github.com/howeyc/fsnotifyfsnotify是一个文件夹监控应用。可以使用创建一个watcher来对某个文件夹进行监控文件目录很简单,实际就两个程序文件,fsnotify.go 和 各平台的fsnotify_XXX.go后一个文件是各个不同平台的实现e…

CentOS7下python3+Flask+uWSGI+Nginx+Supervisor环境搭建

在生产环境中通常用uwsgi作为Flask的web服务网关,通过nginx反向代理进行负载均衡,通过supervior进行服务进行的管理。这一套搭下来还是有一些坑要踩,本文通过一个简单的Flask web应用记录了CentOS7下python3FlaskuWSGINginxSupervisor环境搭建…