python, pyTorch

GNN dataset (dynamic graph)

zooyeonii 2021. 8. 11. 00:16

1. Bitcoin-OTC 

Nodes 5,881
Edges 35,592
Edge weight -10~10
Percentage of positive edges 89%

Data Format 

  • SOURCE: node id of source, i.e., rater
  • TARGET: node id of target, i.e., ratee
  • RATING: the source's rating for the target, ranging from -10 to +10 in steps of 1
  • TIME: the time of the rating, measured as seconds since Epoch. 

해당 데이터셋은, 피어들이 서로의 신뢰도 점수를 매기고, 이를 edge weight 로 한다. Edge prediction (다음 스텝에 피어가 다른 피어의 신뢰도를 몇으로 매길지... 등)을 알 수 있다. 신뢰도 점수 데이터라는 것이,, 어떤 근거로 발생한 점수인지 아니면 단순히 예측이 맞는지 아닌지를 판단하기 위한 수치인지 아직 잘 모르겠다.. 

2. Bitcoin Alpha trust weighted signed network 

1번 데이터셋과 동일한데, 블록체인 플랫폼(비트코인 알파)의 차이이다. 

3. Autonomous systems AS-733

4. Elliptic : Bitcoin transaction graph

전체 2% 가 illicit class (fraud 한 Tx) 로 라벨링되어있고, 21% 는 licit (합법 Tx)로 라벨링되어 있다. 나머지는 라벨을 모르는 상태 (ground-truth은 따로 주어지는 것 같다). 주로 트랜잭션 클러스터링을 할 때 쓰인다. 
-> 어떤 트랜잭션이 fraud행위를 하는지 classify하는 문제에 사용됨.  attribute가 굉장히 많다..(약 170개) 

'python, pyTorch' 카테고리의 다른 글

pytorch : txt파일 전처리  (0) 2021.08.11
torch_geometric.utils  (0) 2021.08.11
tensorflow-gpu 에러 (해결)  (0) 2021.08.07
torch-geometric install error(2)  (0) 2021.08.06
torch-geometric install error(1) CUDA 재설치  (0) 2021.08.06