mssql数据导入汇总后排编码不规范(mssql数据导入乱码)

处理

正确书写编码格式是十分重要的,尤其是面对大数据时,SQL Server 数据库是基于 mssql 格式,如果排编码不规范,会带来诸多麻烦,那么如何在 mssql 数据汇总后处理不规范的排编码呢?

首先,要安装并正确配置SQL Server,然后安装NumPy包,使用NumPy可以读取不规则的排编码类型,下面是安装NumPy包的代码:

pip install numpy

该代码可以安装NumPy包,用户可以在安装完该包后,使用以下代码将mssql数据库数据导入NumPy包:

import pandas as pd

from sqlalchemy import create_engine

engine = create_engine(“mssql+pymssql://username:password@host/dbname”)

df = pd.read_sql(‘SELECT * FROM YourTableName’,engine)

接下来,使用Series对象将导入的排编码不规则的字段进行处理,下面是数据排编码格式不规则的处理代码:

from pandas import Series

series = Series.from_array(df[“YourColumnName”])

series.str.strip()

str.strip()方法的作用是移除指定字符串的某些字符,包括前后及中间的字符,从而达到正确的排编码格式,最后使用以下代码把整理的排编码数据存入mssql数据库中:

series.to_sql(‘NewTableName’,engine,if_exists=’append’,index=False)

以上代码可以实现mssql数据汇总后排编码不规范处理,只要把NumPy包配置好、安装好,在汇总后使用Series对象处理,上述步骤就可以完成。


数据运维技术 » mssql数据导入汇总后排编码不规范(mssql数据导入乱码)