什么是JSON?怎么用Python来编码+解码JSON对象?
本章节我们将为大家介绍如何使用 Python 语言来编码和解码 JSON 对象。
json处理模块的主要任务,是将一个JSON对象,转换成Python数据类型数据进行处理,或者反之,将Python数据类型数据,转换成JSON对象(字符串流),在不同的模块或者系统间传输。
- 对象表示为键值对
- 数据由逗号分隔
- 花括号保存对象
- 方括号保存数组
上面就是一个JSON格式数据。它开起来就像是在Python中的字典数据类型。我们可以通过json模块将它转换成字符串或者反过来将字符串转换成字典数据类型。
JSON也支持各种数据类型,它的数据类型和Python各种数据类型之间的对比如下:
- object —— dict
- array —— list
- string —— str
- number —— int/float
- true/false —— True/False
- null —— None
在json模块中,用于处理json的主要是四个函数,分别是:
- loads():从JSON字符串中读取数据并转换成Python数据类型
- load():从JSON文件中读取数据并转换成Python数据类型
- dumps():将Python数据类型数据转换成JSON字符串
- dump():将Python数据类型数据转换成JSON字符串写入到文件
- 从JSON数据转换到Python数据,叫反系列化(deserialization)
- 从Python数据转换到JSON数据,叫系列化(serialization)
系列化:将Python数据转换成JSON字符串的方法。
下面我们先来看一个简单的例子。
上面的例子中,虽然看起来数据没有发生变化,但其实它们的数据类型已经发生了本质的改变:将字典数据类型的data,转换成了str类型,然后我们就可以将这个str类型的数据转换成流,在网络上进行传输或者写入到文件等。
将data写入txt文件中
这样就将data写入了students.txt,看看是不是已经将数据写进去了。
从JSON数据转换到Python类型数据,叫反系列化。可以通过loads()/load()这两个方法来完成。
- parse_int参数
默认值为None,如果指定了parse_int,用来对JSON int字符串进行解码,这可以用于为JSON整数使用另一种数据类型或解析器。
parse_int参数,这里我们简单将其指定为float类型。
可以看到,age原来是整数类型,通过parse_int已经被转换成了float类型。
- object_hook
默认值为None,object_hook是一个可选函数,此功能可用于实现自定义解码器。指定一个函数,该函数负责把反序列化后的基本类型对象转换成自定义类型的对象。
到这里就结束了,如果对你有帮助,欢迎点赞关注评论,你的点赞对我很重要
作者:北山啦
原文链接:https://blog.csdn.net/qq_45176548/article/details/115119022
干货 | 如何利用Python处理JSON格式的数据,建议收藏
作者: 俊欣
来源: 关于数据分析与可视化
JSON数据格式在我们的日常工作中经常会接触到,无论是做爬虫开发还是一般的数据分析处理,今天,小编就来分享一下当数据接口是JSON格式时,如何进行数据处理进行详细的介绍,内容分布如下
- 什么是JSON
- JSON模块的使用方法
什么是JSON
JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式,通常是以键值对的方式呈现,其简洁和清晰的层次结构使得JSON成为理想的数据交换语言,而在Python中处理JSON格式的模块有json和pickle两个
- json模块和pickle都提供了四个方法:dumps, dump, loads, load
- 序列化:将python的数据转换为json格式的字符串
- 反序列化:将json格式的字符串转换成python的数据类型
序列化
首先我们来看一下序列化是如何操作的,我们首先用json.dump()将字典写入json格式的文件中
能够进行类似操作的则是dataframe当中的to_json()方法,比方说
而当你分别打开这两个文件时,里面的内容分别是以键值对呈现的json数据。另外,我们看到有json.dumps()和json.dump(), 两者看着十分的相似,但是在功能上可是大相径庭,json.dump()进行的是对json文件的读写操作,就比如上述的例子中,我们将字典数据写入json的文件中用的就是json.dump,而json.dumps()则是聚焦于数据本身类型的转换,对数据的操作,比如
反序列化
在反序列化的过程中,我们需要用到的则是json.load()和json.loads()方法,比如说
可以看到的是变量teachers的类型是字典类型,所以可以通过相应的方式来获取以及改变其中的数值以及格式,另外一种方法则是通过pandas模块中的read_json()方法,例如
从上述的例子中可以看出,json.load()主要处理的是json格式的文件,而json.loads()主要是对JSON编码的字符串进行数据类型的转换,
总结
本文主要是讲了序列化与反序列化的相关操作步骤,读者需要在其中留心的则是json.loads()与json.load(),以及json.dumps()和json.dump()之间的区别和使用场景,总的来说
- json.loads():是将json格式的字符串(str)转换为字典类型(dict)的数据
- json.dumps():返回来,是将字典类型(dict)的数据转换成json格式的字符串
- json.load():用于读取json格式的文件,将文件中的数据转换为字典类型(dict)
- json.dump():主要用于存入json格式的文件,将字典类型转换为json形式的字符串
本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com
文章为作者独立观点不代本网立场,未经允许不得转载。