deepwalk 설정 및 사용

2799 단어 종합 하 다
소스 코드 다운로드
https://github.com/phanein/deepwalk 데이터 세트 정의
http://leitang.net/social_dimension. html 핵심 코드
    walks = graph.build_deepwalk_corpus(G, num_paths=args.number_walks, path_length=args.walk_length, alpha=0, rand=random.Random(args.seed))           print("Training...")           model = Word2Vec(walks, size=args.representation_size, window=args.window_size, min_count=0, workers=args.workers)
설치 하 다.
    cd deepwalk-master     pip install -r requirements.txt     python setup.py install
시험 결 과 를 재현 하 다.
1. BlogCatalog dataset
임 베 딩 생 성
deepwalk --format mat --input example_graphs/blogcatalog.mat --max-memory-data-size 0 --number-walks 80 --representation-size 128 --walk-length 40 --window-size 10 --workers 1 --output example_graphs/blogcatalog.embeddings

평가 하 다.
python example_graphs/scoring.py --emb example_graphs/blogcatalog.embeddings --network example_graphs/blogcatalog.mat --num-shuffle 10 --all
2. Karate dataset
임 베 딩 생 성
-- format 기본. adjlist 파일
deepwalk --input example_graphs/karate.adjlist --max-memory-data-size 0 --number-walks 80 --representation-size 128 --walk-length 40 --window-size 10 --workers 1 --output example_graphs/karate.embeddings

평가 하 다.
-- network 는. mat 파일 이 필요 하 다
옵션 은 다음 과 같 습 니 다.
    usage: scoring [-h] --emb EMB --network NETWORK                    [--adj-matrix-name ADJ_MATRIX_NAME]                    [--label-matrix-name LABEL_MATRIX_NAME]                    [--num-shuffles NUM_SHUFFLES] [--all]           optional arguments:       -h, --help            show this help message and exit       --emb EMB             Embeddings file (default: None)       --network NETWORK     A .mat file containing the adjacency matrix and node                             labels of the input network. (default: None)       --adj-matrix-name ADJ_MATRIX_NAME                             Variable name of the adjacency matrix inside the .mat                             file. (default: network)       --label-matrix-name LABEL_MATRIX_NAME                             Variable name of the labels matrix inside the .mat                             file. (default: group)       --num-shuffles NUM_SHUFFLES                             Number of shuffles. (default: 2)       --all                 The embeddings are evaluated on all training percents                             from 10 to 90 when this flag is set to true. By                             default, only training percents of 10, 50 and 90 are                             used. (default: False) ---------------------   작성 자: YizhuJiao  출처: CSDN  원문:https://blog.csdn.net/YizhuJiao/article/details/81095346   저작권 성명: 본 고 는 블 로 거들 의 오리지널 글 입 니 다. 블 로 거들 링크 를 동봉 해 주 십시오!

좋은 웹페이지 즐겨찾기