Linux Shell 프로 그래 밍 실전 - 셸 이미지 다운로드 신기 실현
$ cat dowonload_p_w_picpath.sh
#!/bin/bash
#########################################
# #
#script_name: dowonload_p_w_picpath.sh #
#author:weixiaoxin write by 2017-09-20 #
#########################################
function get_second_level_url(){
#declare -A url_array
UA="Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"
curl -L -s -o tmp.html -H "User-Agent: $UA" $1
u=`cat tmp.html|grep -E -o "/Html/63/[0-9]+\.html\" target=\"_blank\">[0-9]{2}-[0-9]{2}"|sed 's/ /_/ '`
for line in $u
do
#echo $line
url=`echo $line|grep -E -o "/Html/63/[0-9]+\.html"`
datetime=`echo $line|grep -E -o "[0-9]{2}-[0-9]{2}"`
url_date+="$url,$datetime
"
#url_array[$url]=$datetime
done
echo ${url_date}
}
function get_p_w_picpath(){
UA="Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"
curl -L -s -o tmp.html -H "User-Agent: $UA" $1
title=`cat tmp.html|grep -E -o ".* "|sed 's/[| ]//g'`
datetime=$2
img_url=`cat tmp.html|grep -E -o "https://img.997pp.com/tp/[0-9]{4}/[0-9]{2}/[a-zA-Z0-9]+.jpg"`
if [ ! -d "data/${datetime}/${title}" ]
then
mkdir -p data/$datetime/${title}
fi
n=1
for i in $img_url
do
echo $i
i=`echo $i|sed 's/https/http/g'`
curl -L -s -o data/${datetime}/${title}/$n.jpg -H "User-Agent: $UA" $i
sleep 2
let n=n+1
echo $n
done
}
baseurl="https://www.1368k.com/Html/63/"
first_url="${baseurl}index.html"
second_url=`get_second_level_url ${first_url}`
for line in `echo -e $second_url`
do
#echo $line
url=`echo $line|awk -F',' '{print $1}'`
url="https://www.1368k.com/$url"
datetime=`echo $line|awk -F',' '{print $2}'`
#echo $url $datetime
get_p_w_picpath $url $datetime
sleep 5
done
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
바이너리 파일cat 또는tail, 터미널 디코딩 시 처리 방법cat으로 바이너리 파일을 보려고 할 때 코드가 엉망이 되어 식은땀이 났다. 웹에서 스크롤된 정보의 처리 방법과alias의 설정을 요약합니다. reset 명령을 사용하여 터미널을 재설정합니다.이렇게 하면 고치지 못하...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.