1. Bitcoin-OTC
Nodes | 5,881 |
Edges | 35,592 |
Edge weight | -10~10 |
Percentage of positive edges | 89% |
Data Format
- SOURCE: node id of source, i.e., rater
- TARGET: node id of target, i.e., ratee
- RATING: the source's rating for the target, ranging from -10 to +10 in steps of 1
- TIME: the time of the rating, measured as seconds since Epoch.
해당 데이터셋은, 피어들이 서로의 신뢰도 점수를 매기고, 이를 edge weight 로 한다. Edge prediction (다음 스텝에 피어가 다른 피어의 신뢰도를 몇으로 매길지... 등)을 알 수 있다. 신뢰도 점수 데이터라는 것이,, 어떤 근거로 발생한 점수인지 아니면 단순히 예측이 맞는지 아닌지를 판단하기 위한 수치인지 아직 잘 모르겠다..
2. Bitcoin Alpha trust weighted signed network
1번 데이터셋과 동일한데, 블록체인 플랫폼(비트코인 알파)의 차이이다.
4. Elliptic : Bitcoin transaction graph
전체 2% 가 illicit class (fraud 한 Tx) 로 라벨링되어있고, 21% 는 licit (합법 Tx)로 라벨링되어 있다. 나머지는 라벨을 모르는 상태 (ground-truth은 따로 주어지는 것 같다). 주로 트랜잭션 클러스터링을 할 때 쓰인다.
-> 어떤 트랜잭션이 fraud행위를 하는지 classify하는 문제에 사용됨. attribute가 굉장히 많다..(약 170개)
'python, pyTorch' 카테고리의 다른 글
pytorch : txt파일 전처리 (0) | 2021.08.11 |
---|---|
torch_geometric.utils (0) | 2021.08.11 |
tensorflow-gpu 에러 (해결) (0) | 2021.08.07 |
torch-geometric install error(2) (0) | 2021.08.06 |
torch-geometric install error(1) CUDA 재설치 (0) | 2021.08.06 |