[linux] Wget 출력 문서 및 헤더를 STDOUT에

wget을 사용하여 문서 본문과 헤더를 stdout에 출력하려고합니다. wget -S -O - http://google.com

그러나 그것은 html 문서만을 보여줍니다.

감사

UPD :

일했다 wget --save-headers --output-document - http://google.com

wget --version GNU Wget 1.11.4 수정 된 Red Hat 표시



답변

추가 헤더없이 다음을 시도하십시오.

wget -qO- www.google.com

후행 -. 이것은 -O파일로 이동하기 위한 일반적인 명령 인수의 일부 이지만 파일을 지정하는 데 사용하지 않기 >때문에 쉘로 이동합니다. 당신은 사용할 수 있습니다 -qO-또는 -qO -.


답변

wget -S -O - http://google.com예상대로 작동 하지만 주의해야합니다. 헤더는 디버깅 정보로 간주 되어 표준 출력이 아닌 표준 오류 로 전송됩니다 . 표준 출력을 파일이나 다른 프로세스로 리디렉션하는 경우 문서 내용 만 가져옵니다.

가능한 해결책으로 표준 오류를 표준 출력으로 리디렉션 할 수 있습니다. 예를 들면 다음과 bash같습니다.

$ wget -q -S -O - 2>&1 | grep ...

또는

$ wget -q -S -O - 1>wget.txt 2>&1

-q옵션은 진행률 표시 줄과 다른 성가 시게 수다스러운 wget출력 부분을 ​​억제합니다 .


답변

여기에서 작동합니다.

    $ wget -S -O - http://google.com
HTTP request sent, awaiting response...
  HTTP/1.1 301 Moved Permanently
  Location: http://www.google.com/
  Content-Type: text/html; charset=UTF-8
  Date: Sat, 25 Aug 2012 10:15:38 GMT
  Expires: Mon, 24 Sep 2012 10:15:38 GMT
  Cache-Control: public, max-age=2592000
  Server: gws
  Content-Length: 219
  X-XSS-Protection: 1; mode=block
  X-Frame-Options: SAMEORIGIN
Location: http://www.google.com/ [following]
--2012-08-25 12:20:29--  http://www.google.com/
Resolving www.google.com (www.google.com)... 173.194.69.99, 173.194.69.104, 173.194.69.106, ...

  ...skipped a few more redirections ...

    [<=>                                                                                                                                     ] 0           --.-K/s
<!doctype html><html itemscope="itemscope" itemtype="http://schema.org/WebPage"><head><meta itemprop="image" content="/images/google_favicon_128.png"><ti

... skipped ...

wget ( ~$ wget --version
GNU Wget 1.14 built on linux-gnu.
) 을 업데이트해야 할 수도 있습니다.


답변

이것은 헤더로 응답을 인쇄하는 데 도움이되었습니다.

wget --server-response http://www.example.com/


답변

작동하지 않습니다.

wget -q -S -O - google.com 1>wget.txt 2>&1

리디렉션은 오른쪽에서 왼쪽으로 평가되므로 html을 wget.txt로, 헤더를 STDOUT으로 보냅니다.

wget -q -S -O - google.com 2>&1 1>wget.txt


답변