解决Python抓HTML结构存入数据库转义报错问题
首先需求是这样的,抓一些资讯(带有标准的html结构入库),然后研究了半天,各种手动转义,尝试了很多种方法都没有效的解决,下面是有效的最后转义的方案,下面这种入库是没有转义符号的,和原html是一样的,如果前台需要带转义符号需要手动替换一下
newSql
=
db
.
escape
(
param
)
sql
=
'INSERT INTO zhixun (htmls) VALUES({})'
.
format
(
newSql
)
数据库
比较懒了没有手写,参考了一下别人的,这样入库是带转义符号的
def
transferContent
(
content
)
:
if
content
is
None
:
return
None
else
:
stri
=
""
for
c
in
content
:
if
c
==
'"'
:
stri
+=
c
.
replace
(
'"'
,
'\\\"'
)
elif
c
==
"'"
:
stri
+=
c
.
replace
(
"'"
,
"\\\'"
)
elif
c
==
"\\"
:
stri
+=
"\\\\"
else
:
stri
+=
str
(
c
)
return
stri
数据库