[python] 문자열을 16 진 바이트로 인쇄 하시겠습니까?

이 문자열이 있습니다 : Hello world !!Python as를 사용하여 인쇄하고 싶습니다 48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21.

hex() 정수에만 작동합니다.

어떻게 할 수 있습니까?



답변

문자열을 정수 생성기로 변환하고 각 요소에 16 진수 형식을 적용하고 구분 기호를 삽입 할 수 있습니다.

>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21


답변

':'.join(x.encode('hex') for x in 'Hello World!')


답변

Python 2.x의 경우 :

':'.join(x.encode('hex') for x in 'Hello World!')

위의 코드는 Python 3.x 에서는 작동하지 않으며 3.x에서는 아래 코드가 작동합니다.

':'.join(hex(ord(x))[2:] for x in 'Hello World!')


답변

두 줄로 된 또 다른 대답은 읽기가 더 쉽고 문자열에서 줄 바꿈이나 다른 이상한 문자를 디버깅하는 데 도움이됩니다.

파이썬 2.7

for character in string:
    print character, character.encode('hex')

Python 3.7 (모든 릴리스 3에서 테스트되지는 않음)

for character in string:
    print(character, character.encode('utf-8').hex())


답변

Fedor Gogolev의 답변에 대한 일부 보완 사항 :

먼저 문자열에 ‘ASCII 코드’가 10 미만인 문자가 포함 된 경우 필요에 따라 표시되지 않습니다. 이 경우 올바른 형식은 다음 {:02x}과 같아야합니다 .

>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
                                           ^^

둘째, “문자열”이 실제로 “바이트 문자열”인 경우-파이썬 3의 차이점 때문에 다음을 선호 할 수 있습니다.

>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'

바이트 객체가 “0 <= x <256 범위의 불변의 정수 시퀀스”로 정의 되므로 위 코드에서 변환 할 필요가 없습니다 .


답변

문자열을 16 진 바이트로 인쇄 하시겠습니까?

허용되는 답변은 다음과 같습니다.

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

보고:

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

허용 된 답변은 바이트 (대부분 ASCII 문자)를 사용하는 경우에만 작동합니다. 그러나 유니 코드를 사용하는 경우 예를 들면 다음과 같습니다.

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

어떻게 든 바이트로 변환해야합니다.

터미널에서 이러한 문자를 사용할 수없는 경우 UTF-8에서 디코딩하거나 이름을 사용할 수 있습니다 (따라서 코드를 붙여 넣어 실행할 수 있습니다).

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

그래서 우리는 그것을 본다 :

":".join("{:02x}".format(ord(c)) for c in a_string)

보고

'41f:440:438:432:435:442:20:43c:438:440:21:21'

불충분 한 / 예기치 않은 결과- 유니 코드 컨소시엄에서 유니 코드로 볼 수있는 그래 핀 을 만들기 위해 결합 된 코드 포인트 로 전세계 언어를 나타냅니다. 그러나이 정보를 실제로 저장하는 방법 은 아니므 로 다른 출처에서 해석 할 수 있습니다.

다른 소스가이 데이터를 사용할 수있게하려면 일반적으로이 문자열을 바이트 단위로 디스크에 저장하거나 html에 게시하는 등의 UTF-8 인코딩으로 변환해야합니다. 따라서 파이썬 3에서는 정수를 반복 할 수 있기 때문에 코드 포인트를 UTF-8 의 코드 단위 로 변환하기위한 인코딩이 필요합니다 .ordbytes

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

또는 새로운 f- 문자열을 사용하여 더 우아하게 (파이썬 3에서만 사용 가능) :

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

파이썬 2에서, 패스 cord첫 번째, 즉 ord(c)– 더 많은 예제 :

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'


답변

당신이 사용할 수있는 hexdump‘들

import hexdump
hexdump.dump("Hello World", sep=":")

( .lower()소문자가 필요한 경우 추가 ). 이것은 Python 2와 3 모두에서 작동합니다.