connecting_the_dots/data/dataset.py

import torch
import torch.utils.data
import numpy as np
import matplotlib.pyplot as plt
import itertools
import pickle
import json
import time
from pathlib import Path
import collections
import cv2
import sys
import os
import time
import glob

import torchext
import renderer
import co
from .commons import get_patterns, augment_image

from mpl_toolkits.mplot3d import Axes3D

class TrackSynDataset(torchext.BaseDataset):
  '''
  Load locally saved synthetic dataset
  Please run ./create_syn_data.sh to generate the dataset
  '''
  def __init__(self, settings_path, sample_paths, track_length=2, train=True, data_aug=False):
    super().__init__(train=train)

    self.settings_path = settings_path
    self.sample_paths = sample_paths
    self.data_aug = data_aug
    self.train = train
    self.track_length=track_length
    assert(track_length<=4)

    with open(str(settings_path), 'rb') as f:
      settings = pickle.load(f)
    self.imsizes = settings['imsizes']
    self.patterns = settings['patterns']
    self.focal_lengths = settings['focal_lengths']
    self.baseline = settings['baseline']
    self.K = settings['K']

    self.scale = len(self.imsizes)

    self.max_shift=0
    self.max_blur=0.5
    self.max_noise=3.0
    self.max_sp_noise=0.0005

  def __len__(self):
    return len(self.sample_paths)

  def __getitem__(self, idx):
    if not self.train:
      rng = self.get_rng(idx)
    else:
      rng = np.random.RandomState()
    sample_path = self.sample_paths[idx]

    if self.train:
      track_ind = np.random.permutation(4)[0:self.track_length]
    else:
      track_ind = [0]

    ret = {}
    ret['id'] = idx

    # load imgs, at all scales
    for sidx in range(len(self.imsizes)):
      imgs = []
      ambs = []
      grads = []
      for tidx in track_ind:
        imgs.append(np.load(os.path.join(sample_path,f'im{sidx}_{tidx}.npy')))
        ambs.append(np.load(os.path.join(sample_path,f'ambient{sidx}_{tidx}.npy')))
        grads.append(np.load(os.path.join(sample_path,f'grad{sidx}_{tidx}.npy')))
      ret[f'im{sidx}'] = np.stack(imgs, axis=0)
      ret[f'ambient{sidx}'] = np.stack(ambs, axis=0)
      ret[f'grad{sidx}'] = np.stack(grads, axis=0)

    # load disp and grad only at full resolution
    disps = []
    R = []
    t = []
    for tidx in track_ind:
      disps.append(np.load(os.path.join(sample_path,f'disp0_{tidx}.npy')))
      R.append(np.load(os.path.join(sample_path,f'R_{tidx}.npy')))
      t.append(np.load(os.path.join(sample_path,f't_{tidx}.npy')))
    ret[f'disp0'] = np.stack(disps, axis=0)
    ret['R'] = np.stack(R, axis=0)
    ret['t'] = np.stack(t, axis=0)

    blend_im = np.load(os.path.join(sample_path,'blend_im.npy'))
    ret['blend_im'] = blend_im.astype(np.float32)

    #### apply data augmentation at different scales seperately, only work for max_shift=0
    if self.data_aug:
      for sidx in range(len(self.imsizes)):
        if sidx==0:
          img = ret[f'im{sidx}']
          disp = ret[f'disp{sidx}']
          grad = ret[f'grad{sidx}']
          img_aug = np.zeros_like(img)
          disp_aug = np.zeros_like(img)
          grad_aug = np.zeros_like(img)
          for i in range(img.shape[0]):
            img_aug_, disp_aug_, grad_aug_ = augment_image(img[i,0],rng,
                    disp=disp[i,0],grad=grad[i,0],
                    max_shift=self.max_shift, max_blur=self.max_blur, 
                    max_noise=self.max_noise, max_sp_noise=self.max_sp_noise)
            img_aug[i] = img_aug_[None].astype(np.float32)
            disp_aug[i] = disp_aug_[None].astype(np.float32)
            grad_aug[i] = grad_aug_[None].astype(np.float32)
          ret[f'im{sidx}'] = img_aug
          ret[f'disp{sidx}'] = disp_aug
          ret[f'grad{sidx}'] = grad_aug
        else:
          img = ret[f'im{sidx}']
          img_aug = np.zeros_like(img)
          for i in range(img.shape[0]):
            img_aug_, _, _ = augment_image(img[i,0],rng,
                    max_shift=self.max_shift, max_blur=self.max_blur, 
                    max_noise=self.max_noise, max_sp_noise=self.max_sp_noise)
            img_aug[i] = img_aug_[None].astype(np.float32)
          ret[f'im{sidx}'] = img_aug

    if len(track_ind)==1:
      for key, val in ret.items():
        if key!='blend_im' and key!='id':
          ret[key] = val[0]


    return ret

  def getK(self, sidx=0):
    K = self.K.copy() / (2**sidx)
    K[2,2] = 1
    return K

        
if __name__ == '__main__':
  pass
init 5 years ago			`import torch`
			`import torch.utils.data`
			`import numpy as np`
			`import matplotlib.pyplot as plt`
			`import itertools`
			`import pickle`
			`import json`
			`import time`
			`from pathlib import Path`
			`import collections`
			`import cv2`
			`import sys`
			`import os`
			`import time`
			`import glob`

			`import torchext`
			`import renderer`
			`import co`
			`from .commons import get_patterns, augment_image`

			`from mpl_toolkits.mplot3d import Axes3D`

			`class TrackSynDataset(torchext.BaseDataset):`
			`'''`
			`Load locally saved synthetic dataset`
			`Please run ./create_syn_data.sh to generate the dataset`
			`'''`
			`def __init__(self, settings_path, sample_paths, track_length=2, train=True, data_aug=False):`
			`super().__init__(train=train)`

			`self.settings_path = settings_path`
			`self.sample_paths = sample_paths`
			`self.data_aug = data_aug`
			`self.train = train`
			`self.track_length=track_length`
			`assert(track_length<=4)`

			`with open(str(settings_path), 'rb') as f:`
			`settings = pickle.load(f)`
			`self.imsizes = settings['imsizes']`
			`self.patterns = settings['patterns']`
			`self.focal_lengths = settings['focal_lengths']`
			`self.baseline = settings['baseline']`
			`self.K = settings['K']`

			`self.scale = len(self.imsizes)`

			`self.max_shift=0`
			`self.max_blur=0.5`
			`self.max_noise=3.0`
			`self.max_sp_noise=0.0005`

			`def __len__(self):`
			`return len(self.sample_paths)`

			`def __getitem__(self, idx):`
			`if not self.train:`
			`rng = self.get_rng(idx)`
			`else:`
			`rng = np.random.RandomState()`
			`sample_path = self.sample_paths[idx]`

			`if self.train:`
			`track_ind = np.random.permutation(4)[0:self.track_length]`
			`else:`
			`track_ind = [0]`

			`ret = {}`
			`ret['id'] = idx`

			`# load imgs, at all scales`
			`for sidx in range(len(self.imsizes)):`
			`imgs = []`
			`ambs = []`
			`grads = []`
			`for tidx in track_ind:`
			`imgs.append(np.load(os.path.join(sample_path,f'im{sidx}_{tidx}.npy')))`
			`ambs.append(np.load(os.path.join(sample_path,f'ambient{sidx}_{tidx}.npy')))`
			`grads.append(np.load(os.path.join(sample_path,f'grad{sidx}_{tidx}.npy')))`
			`ret[f'im{sidx}'] = np.stack(imgs, axis=0)`
			`ret[f'ambient{sidx}'] = np.stack(ambs, axis=0)`
			`ret[f'grad{sidx}'] = np.stack(grads, axis=0)`

			`# load disp and grad only at full resolution`
			`disps = []`
			`R = []`
			`t = []`
			`for tidx in track_ind:`
			`disps.append(np.load(os.path.join(sample_path,f'disp0_{tidx}.npy')))`
			`R.append(np.load(os.path.join(sample_path,f'R_{tidx}.npy')))`
			`t.append(np.load(os.path.join(sample_path,f't_{tidx}.npy')))`
			`ret[f'disp0'] = np.stack(disps, axis=0)`
			`ret['R'] = np.stack(R, axis=0)`
			`ret['t'] = np.stack(t, axis=0)`

			`blend_im = np.load(os.path.join(sample_path,'blend_im.npy'))`
			`ret['blend_im'] = blend_im.astype(np.float32)`

			`#### apply data augmentation at different scales seperately, only work for max_shift=0`
			`if self.data_aug:`
			`for sidx in range(len(self.imsizes)):`
			`if sidx==0:`
			`img = ret[f'im{sidx}']`
			`disp = ret[f'disp{sidx}']`
			`grad = ret[f'grad{sidx}']`
			`img_aug = np.zeros_like(img)`
			`disp_aug = np.zeros_like(img)`
			`grad_aug = np.zeros_like(img)`
			`for i in range(img.shape[0]):`
			`img_aug_, disp_aug_, grad_aug_ = augment_image(img[i,0],rng,`
			`disp=disp[i,0],grad=grad[i,0],`
			`max_shift=self.max_shift, max_blur=self.max_blur,`
			`max_noise=self.max_noise, max_sp_noise=self.max_sp_noise)`
			`img_aug[i] = img_aug_[None].astype(np.float32)`
			`disp_aug[i] = disp_aug_[None].astype(np.float32)`
			`grad_aug[i] = grad_aug_[None].astype(np.float32)`
			`ret[f'im{sidx}'] = img_aug`
			`ret[f'disp{sidx}'] = disp_aug`
			`ret[f'grad{sidx}'] = grad_aug`
			`else:`
			`img = ret[f'im{sidx}']`
			`img_aug = np.zeros_like(img)`
			`for i in range(img.shape[0]):`
			`img_aug_, _, _ = augment_image(img[i,0],rng,`
			`max_shift=self.max_shift, max_blur=self.max_blur,`
			`max_noise=self.max_noise, max_sp_noise=self.max_sp_noise)`
			`img_aug[i] = img_aug_[None].astype(np.float32)`
			`ret[f'im{sidx}'] = img_aug`

			`if len(track_ind)==1:`
			`for key, val in ret.items():`
			`if key!='blend_im' and key!='id':`
			`ret[key] = val[0]`


			`return ret`

			`def getK(self, sidx=0):`
			`K = self.K.copy() / (2**sidx)`
			`K[2,2] = 1`
			`return K`



			`if __name__ == '__main__':`
			`pass`