[python] 사전의 문자열 표현을 사전으로 변환 하시겠습니까?

다음 문자열과 같은 의 str표현을 어떻게?로 변환 할 수 있습니까?dictdict

s = "{'muffin' : 'lolz', 'foo' : 'kitty'}"

나는 사용하지 않는 것이 좋습니다 eval. 다른 무엇을 사용할 수 있습니까?

이것의 주된 이유는 그가 작성한 동료 클래스 중 하나이기 때문에 모든 입력을 문자열로 변환합니다. 나는이 문제를 다루기 위해 수업을 수정하고 기분이 좋지 않습니다.



답변

파이썬 2.6부터는 내장 함수를 사용할 수 있습니다 ast.literal_eval:

>>> import ast
>>> ast.literal_eval("{'muffin' : 'lolz', 'foo' : 'kitty'}")
{'muffin': 'lolz', 'foo': 'kitty'}

이것은을 사용하는 것보다 안전 eval합니다. 자체 문서에서 말하는 것처럼 :

>>> help (ast.literal_eval)
ast 모듈의 literal_eval 함수에 대한 도움말 :

literal_eval (노드 _ 또는 _ 문자열)
    표현식 노드 또는 파이썬을 포함하는 문자열을 안전하게 평가
    표현. 제공된 문자열 또는 노드는 다음으로 만 구성 될 수 있습니다
    파이썬 리터럴 구조 : 문자열, 숫자, 튜플,리스트, dicts, booleans,
    그리고 없음.

예를 들면 다음과 같습니다.

>>> eval("shutil.rmtree('mongo')")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<string>", line 1, in <module>
  File "/opt/Python-2.6.1/lib/python2.6/shutil.py", line 208, in rmtree
    onerror(os.listdir, path, sys.exc_info())
  File "/opt/Python-2.6.1/lib/python2.6/shutil.py", line 206, in rmtree
    names = os.listdir(path)
OSError: [Errno 2] No such file or directory: 'mongo'
>>> ast.literal_eval("shutil.rmtree('mongo')")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/opt/Python-2.6.1/lib/python2.6/ast.py", line 68, in literal_eval
    return _convert(node_or_string)
  File "/opt/Python-2.6.1/lib/python2.6/ast.py", line 67, in _convert
    raise ValueError('malformed string')
ValueError: malformed string


답변

https://docs.python.org/3.8/library/json.html

JSON은 디코더가 키와 값 주위에 큰 따옴표를 원하지만이 문제를 해결할 수 있습니다. 교체 해킹이 마음에 들지 않으면 …

import json
s = "{'muffin' : 'lolz', 'foo' : 'kitty'}"
json_acceptable_string = s.replace("'", "\"")
d = json.loads(json_acceptable_string)
# d = {u'muffin': u'lolz', u'foo': u'kitty'}

키 또는 값의 일부로 작은 따옴표가 있으면 문자를 잘못 교체하면 실패합니다. 이 솔루션은 평가 솔루션에 대한 강력한 혐오가있는 경우에만 권장됩니다.

json 작은 따옴표에 대한 추가 정보 : jQuery.parseJSON은 JSON에서 작은 따옴표를 이스케이프하여 “잘못된 JSON”오류를 발생시킵니다.


답변

사용하여 json.loads:

>>> import json
>>> h = '{"foo":"bar", "foo2":"bar2"}'
>>> d = json.loads(h)
>>> d
{u'foo': u'bar', u'foo2': u'bar2'}
>>> type(d)
<type 'dict'>


답변

OP의 예를 들면 다음과 같습니다.

s = "{'muffin' : 'lolz', 'foo' : 'kitty'}"

Yaml 을 사용 하여 문자열에서 이런 종류의 비표준 json을 처리 할 수 있습니다 .

>>> import yaml
>>> s = "{'muffin' : 'lolz', 'foo' : 'kitty'}"
>>> s
"{'muffin' : 'lolz', 'foo' : 'kitty'}"
>>> yaml.load(s)
{'muffin': 'lolz', 'foo': 'kitty'}


답변

문자열을 항상 신뢰할 수 있다면 사용 eval하거나 literal_eval제안 된대로 사용할 수 있습니다 ( 문자열이 무엇이든 안전합니다). 그렇지 않으면 파서가 필요합니다. JSON 구문 분석기 (예 : simplejson)는 JSON 체계에 맞는 컨텐츠 만 저장하는 경우 작동합니다.


답변

사용하십시오 json. ast라이브러리는 많은 메모리와 느린을 소모합니다. 156Mb의 텍스트 파일을 읽어야하는 프로세스가 있습니다. Ast변환 사전에 5 분 지연, json60 % 적은 메모리 사용으로 1 분!


답변

요약:

import ast, yaml, json, timeit

descs=['short string','long string']
strings=['{"809001":2,"848545":2,"565828":1}','{"2979":1,"30581":1,"7296":1,"127256":1,"18803":2,"41619":1,"41312":1,"16837":1,"7253":1,"70075":1,"3453":1,"4126":1,"23599":1,"11465":3,"19172":1,"4019":1,"4775":1,"64225":1,"3235":2,"15593":1,"7528":1,"176840":1,"40022":1,"152854":1,"9878":1,"16156":1,"6512":1,"4138":1,"11090":1,"12259":1,"4934":1,"65581":1,"9747":2,"18290":1,"107981":1,"459762":1,"23177":1,"23246":1,"3591":1,"3671":1,"5767":1,"3930":1,"89507":2,"19293":1,"92797":1,"32444":2,"70089":1,"46549":1,"30988":1,"4613":1,"14042":1,"26298":1,"222972":1,"2982":1,"3932":1,"11134":1,"3084":1,"6516":1,"486617":1,"14475":2,"2127":1,"51359":1,"2662":1,"4121":1,"53848":2,"552967":1,"204081":1,"5675":2,"32433":1,"92448":1}']
funcs=[json.loads,eval,ast.literal_eval,yaml.load]

for  desc,string in zip(descs,strings):
    print('***',desc,'***')
    print('')
    for  func in funcs:
        print(func.__module__+' '+func.__name__+':')
        %timeit func(string)
    print('')

결과 :

*** short string ***

json loads:
4.47 µs ± 33.4 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
builtins eval:
24.1 µs ± 163 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
ast literal_eval:
30.4 µs ± 299 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
yaml load:
504 µs ± 1.29 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

*** long string ***

json loads:
29.6 µs ± 230 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
builtins eval:
219 µs ± 3.92 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
ast literal_eval:
331 µs ± 1.89 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
yaml load:
9.02 ms ± 92.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

결론 : json.loads를 선호 하십시오.