Simon
/
graph-barlow-twins
mirror of https://github.com/pbielak/graph-barlow-twins


  
1

	
2

	
3

	
4

	
5

	
6

	
7

	
8

	
9

	
10

	
11

	
12

	
13

	
14

	
15

	
16

	
17

	
18

	
19

	
20

	
21

	
22

	
23

	
24

	
25

	
26

	
27

	
28

	
29

	
30

	
31

	
32

	
33

	
34

	
35

	
36

	
37

	
38

	
39

	
40

	
41

	
42

	
43

	
44

	
45

	
46

	
47

	
48

	
49

	
50

	
51

	
52

	
53

	
54

	
55

	
56

	
57

	
58

	
59

	
60

	
61

	
62

	
63

	
64

	
65

	
66

	
67

	
68

	
69

	
70

	
71

	
72

	
            from typing import List, Optional, Tuple, Union

import torch
from torch_geometric.data import Data
from torch_geometric.data.sampler import EdgeIndex


class GraphAugmentor:
    """Masks node features (same for all nodes) and drops edges."""

    def __init__(
        self,
        p_x_1: float,
        p_e_1: float,
        p_x_2: Optional[float] = None,
        p_e_2: Optional[float] = None,
    ):
        self._p_x_1 = p_x_1
        self._p_e_1 = p_e_1

        self._p_x_2 = p_x_2 if p_x_2 is not None else p_x_1
        self._p_e_2 = p_e_2 if p_e_2 is not None else p_e_1

    def __call__(self, data: Data):
        """Augment full-batch graph."""
        x_a = mask_features(data.x, p=self._p_x_1)
        x_b = mask_features(data.x, p=self._p_x_2)

        edge_index_a = drop_edges(data.edge_index, p=self._p_e_1)
        edge_index_b = drop_edges(data.edge_index, p=self._p_e_2)

        return (x_a, edge_index_a), (x_b, edge_index_b)

    def augment_batch(
        self,
        x: torch.Tensor,
        adjs: List[EdgeIndex],
    ):
        """Augment batch from NeighborSampler."""
        x_a = mask_features(x, p=self._p_x_1)
        x_b = mask_features(x, p=self._p_x_2)

        edge_indexes_a = [
            drop_edges(adj.edge_index, p=self._p_e_1)
            for adj in adjs
        ]
        edge_indexes_b = [
            drop_edges(adj.edge_index, p=self._p_e_2)
            for adj in adjs
        ]

        return (x_a, edge_indexes_a), (x_b, edge_indexes_b)


def mask_features(x: torch.Tensor, p: float) -> torch.Tensor:
    num_features = x.size(-1)
    device = x.device

    return bernoulli_mask(size=(1, num_features), prob=p).to(device) * x


def drop_edges(edge_index: torch.Tensor, p: float) -> torch.Tensor:
    num_edges = edge_index.size(-1)
    device = edge_index.device

    mask = bernoulli_mask(size=num_edges, prob=p).to(device) == 1.

    return edge_index[:, mask]


def bernoulli_mask(size: Union[int, Tuple[int, ...]], prob: float):
    return torch.bernoulli((1 - prob) * torch.ones(size))