cosmetic updates

Suwon Shon · Suwon Shon · commit e825450c6bab · 2017-10-17T14:46:02.000-04:00
diff --git a/scripts/ivector_dataset.py b/scripts/ivector_dataset.py
@@ -1,5 +1,4 @@
 import numpy as np
-# import tensorflow as tf
 from tensorflow.python.framework import dtypes
 
 ## ivector :  Sampels X Dimension (2darray)
@@ -77,4 +76,4 @@ def next_batch(self,
         
         
         
-    
+    
diff --git a/scripts/ivector_dataset.py~ b/scripts/ivector_dataset.py~
@@ -0,0 +1,80 @@
+import numpy as np
+# import tensorflow as tf
+from tensorflow.python.framework import dtypes
+
+## ivector :  Sampels X Dimension (2darray)
+## labels : Samples (1darray)
+
+class DataSet(object):
+    
+    def __init__(self,
+                 ivectors,
+                 labels,
+                 dtype=dtypes.float32):
+        
+        self._ivectors = ivectors
+        self._labels = labels
+        self._epochs_completed = 0
+        self._index_in_epoch = 0
+        self._num_examples = ivectors.shape[0]
+        self._dimension = ivectors.shape[1]
+        
+        
+    @property
+    def ivectors(self):
+        return self._ivectors
+    
+    @property
+    def labels(self):
+        return self._labels
+    
+    @property
+    def num_examples(self):
+        return self._num_examples
+    
+    @property
+    def epochs_completed(self):
+        return self._epochs_completed
+    
+    @property
+    def dimension(self):
+        return self._dimension
+    
+    def next_batch(self,
+                   batch_size,
+                   shuffle):
+        head = self._index_in_epoch
+        
+        # shuffling dataset at first batch of every epoch
+        if head == 0 and shuffle:
+            perm = np.arange(self._num_examples)
+            np.random.shuffle(perm)
+            self._ivectors = self.ivectors[perm]
+            self._labels = self.labels[perm]        
+
+        # for last batch size => [total - batch_size : total]
+        if head + batch_size > self._num_examples:
+            self._index_in_epoch = self._num_examples - batch_size
+            head = self._index_in_epoch
+            
+        # Last batch (reset index)
+        if head + batch_size ==  self._num_examples:
+            self._epochs_completed +=1
+            tail = self._index_in_epoch + batch_size
+            self._index_in_epoch = 0
+            return self._ivectors[head:tail], self._labels[head:tail]            
+
+        #normal batch
+        else:
+            self._index_in_epoch += batch_size
+            tail = self._index_in_epoch
+            return self._ivectors[head:tail], self._labels[head:tail]
+        
+        
+        
+           
+        
+        
+        
+        
+    
diff --git a/scripts/ivector_tools.py b/scripts/ivector_tools.py
@@ -1,7 +1,3 @@
-
-# coding: utf-8
-
-
 import numpy as np
 import os, re,gzip,struct
 import scipy as sc
@@ -24,6 +20,7 @@ def read_ivector_text(file):
     file.close()
 
     return ivector
+
 def read_ivector_binary(file, point):
 
     ivecfile = open(file,'r')
@@ -42,24 +39,12 @@ def read_ivector_binary(file, point):
         sample_type = 'float64'
 
     temp=ivecfile.read(1) #int-size
-
     vec_size=struct.unpack('<i',ivecfile.read(4))[0]
-
-
     ivector = np.fromfile(ivecfile,sample_type,vec_size)
-
-#     print binary
-#     print sample_type
-#     print temp
-#     print vec_size
-#     print np.sum(np.power(ivector,2))
-
     ivecfile.close()
 
-
     return ivector
 
-
 def read_ivector_key(file):
     spkid = []
     ivec_pointer=[]
@@ -73,55 +58,44 @@ def read_ivector_key(file):
         total_num +=1
     
     return spkid, ivec_pointer,total_num
+
 def length_norm(mat):
     mat = mat.transpose()
     norm_mat = []
     for line in mat:
         temp = line/np.math.sqrt(sum(np.power(line,2)))
         norm_mat.append(temp)
     norm_mat = np.array(norm_mat)
-    return norm_mat.transpose()
-
 
+    return norm_mat.transpose()
 
 def lda(mat,label):
     # mat = observation x dim ( for example, 8x600 for 8 obs and 600dim ivector)
     # label = num_utts (for example, [2,4,2] for 8 observations)
-    
-#    ivec = [[0,1,2], [0,5,10],[1,5,3],[5,2,1],[5,3,6]]
-#    ivec = np.array(ivec,dtype='float')
-    # print np.shape(ivec)
-    # print ivec
-#    label = [2,3]
+
     #Sw = np.inner(mat.transpose(), mat.transpose())
     Sw = np.dot(mat.transpose(), mat)
     mu_c=[]
     pre_iter2 = 0
     for iter1, iter2 in enumerate(label):
         idx = np.arange(pre_iter2,pre_iter2+iter2)
         pre_iter2 += iter2
-
         temp = mat[idx]
         mu_c.append(np.math.sqrt(iter2) * np.mean(temp,axis=0))
-#        mu_c.append(np.mean(temp,axis=0))
+
     mu_c = np.array(mu_c)
-#    Sb = np.inner(mu_c.transpose(),mu_c.transpose())
+
     Sb = np.dot(mu_c.transpose(),mu_c)
     [D, V] = np.linalg.eig(np.linalg.inv(Sw).dot(Sb))
-#    D = np.real(D)
-#    V = np.real(V)
     descend_idx =  (-D).argsort()
     V= V[:,descend_idx]
     V = length_norm(V)
-    #print V
     
     return V
 
 
 def load_ivector_fromtextark(foldername,num_arks):
 #loading ivectors from text-ark files
-#foldername = '../db_ivectors/data/ivectors_callmynet_enrollment_gmm_2048/'
-#num_arks = 3 
     
     spkid, point, total_num=read_ivector_key(foldername+'ivector.scp')
     ivec1 = []
@@ -133,4 +107,4 @@ def load_ivector_fromtextark(foldername,num_arks):
         ivec1=np.append(ivec1,temp,axis=0)
     spk_ivectors = ivec1
     print 'total',total_num,'ivector were saved on spk_ivector variable(shape is',np.shape(spk_ivectors),' )'
-    return spk_ivectors, spkid, point, total_num
+    return spk_ivectors, spkid, point, total_num
diff --git a/scripts/ivector_tools.py~ b/scripts/ivector_tools.py~
@@ -0,0 +1,136 @@
+
+# coding: utf-8
+
+
+import numpy as np
+import os, re,gzip,struct
+import scipy as sc
+
+def read_ivector_text(file):
+    
+    file = open(file,'r')
+    
+    ivector = []
+    for line in file:
+        a = line.split('[ ')
+        b=a[1].split(' ]')
+        c= b[0].split(' ')
+        dim = np.size(c)
+        d=np.array(c)
+        e=d.astype('float32')
+        ivector.append(e)
+    
+    print np.shape(ivector)
+    file.close()
+
+    return ivector
+def read_ivector_binary(file, point):
+
+    ivecfile = open(file,'r')
+    
+    ivecname = ivecfile.read(point)
+    #print ivecname
+
+    #binary flag
+    binary=ivecfile.read(2)
+    #print binary
+    #type flag (FV for 4 byteor DV for 8)
+    type=ivecfile.read(3)
+    if type == 'FV ': 
+        sample_type='float32'
+    if type =='DV ': 
+        sample_type = 'float64'
+
+    temp=ivecfile.read(1) #int-size
+
+    vec_size=struct.unpack('<i',ivecfile.read(4))[0]
+
+
+    ivector = np.fromfile(ivecfile,sample_type,vec_size)
+
+#     print binary
+#     print sample_type
+#     print temp
+#     print vec_size
+#     print np.sum(np.power(ivector,2))
+
+    ivecfile.close()
+
+
+    return ivector
+
+
+def read_ivector_key(file):
+    spkid = []
+    ivec_pointer=[]
+    total_num = 0
+    scpfile = open(file,'r')
+    for line in scpfile:
+        #print line
+        temp = re.split(' |:|\n',line)
+        spkid.append(temp[0])
+        ivec_pointer.append(int(temp[2]))
+        total_num +=1
+    
+    return spkid, ivec_pointer,total_num
+def length_norm(mat):
+    mat = mat.transpose()
+    norm_mat = []
+    for line in mat:
+        temp = line/np.math.sqrt(sum(np.power(line,2)))
+        norm_mat.append(temp)
+    norm_mat = np.array(norm_mat)
+    return norm_mat.transpose()
+
+
+
+def lda(mat,label):
+    # mat = observation x dim ( for example, 8x600 for 8 obs and 600dim ivector)
+    # label = num_utts (for example, [2,4,2] for 8 observations)
+    
+#    ivec = [[0,1,2], [0,5,10],[1,5,3],[5,2,1],[5,3,6]]
+#    ivec = np.array(ivec,dtype='float')
+    # print np.shape(ivec)
+    # print ivec
+#    label = [2,3]
+    #Sw = np.inner(mat.transpose(), mat.transpose())
+    Sw = np.dot(mat.transpose(), mat)
+    mu_c=[]
+    pre_iter2 = 0
+    for iter1, iter2 in enumerate(label):
+        idx = np.arange(pre_iter2,pre_iter2+iter2)
+        pre_iter2 += iter2
+
+        temp = mat[idx]
+        mu_c.append(np.math.sqrt(iter2) * np.mean(temp,axis=0))
+#        mu_c.append(np.mean(temp,axis=0))
+    mu_c = np.array(mu_c)
+#    Sb = np.inner(mu_c.transpose(),mu_c.transpose())
+    Sb = np.dot(mu_c.transpose(),mu_c)
+    [D, V] = np.linalg.eig(np.linalg.inv(Sw).dot(Sb))
+#    D = np.real(D)
+#    V = np.real(V)
+    descend_idx =  (-D).argsort()
+    V= V[:,descend_idx]
+    V = length_norm(V)
+    #print V
+    
+    return V
+
+
+def load_ivector_fromtextark(foldername,num_arks):
+#loading ivectors from text-ark files
+#foldername = '../db_ivectors/data/ivectors_callmynet_enrollment_gmm_2048/'
+#num_arks = 3 
+    
+    spkid, point, total_num=read_ivector_key(foldername+'ivector.scp')
+    ivec1 = []
+    spk_ivectors = []
+    ivec1 = read_ivector_text(foldername+'ivector.1.ark')
+    for iter1 in np.arange(2,num_arks+1):
+        temp = []
+        temp = read_ivector_text(foldername+'ivector.'+str(iter1)+'.ark')
+        ivec1=np.append(ivec1,temp,axis=0)
+    spk_ivectors = ivec1
+    print 'total',total_num,'ivector were saved on spk_ivector variable(shape is',np.shape(spk_ivectors),' )'
+    return spk_ivectors, spkid, point, total_num
diff --git a/scripts/siamese_model.py b/scripts/siamese_model.py
@@ -12,7 +12,6 @@ def __init__(self):
             scope.reuse_variables()
             self.a1,self.b2,self.o2 = self.network(self.x2)
             
-
         # Create loss
         self.y_ = tf.placeholder(tf.float32, [None])
         self.loss = self.loss_with_cds()
@@ -25,7 +24,6 @@ def network(self, x):
         conv1 = self.conv_layer(x, kernel_size,stride,depth,'conv1')
         conv1r = tf.nn.relu(conv1)
         n_prev_weight = int(x.get_shape()[1])
-#        pool1 = tf.layers.max_pooling1d(conv1,4,2,'same')
         conv1_d = tf.reshape(conv1r,[-1, n_prev_weight/stride*depth])
         
         kernel_size =10
@@ -34,15 +32,12 @@ def network(self, x):
         conv2 = self.conv_layer(conv1_d, kernel_size,stride,depth,'conv2')
         conv2r = tf.nn.relu(conv2)
         n_prev_weight = int(conv1_d.get_shape()[1])
-#        pool2 = tf.layers.max_pooling1d(conv2,4,4,'same')
         conv2_d = tf.reshape(conv2r,[-1, n_prev_weight/stride*depth])
         
         fc1 = self.fc_layer(conv1_d, 1500, "fc1")
         ac1 = tf.nn.relu(fc1)
-#        fc1_drop = tf.nn.dropout(ac1, 0.1)
         fc2 = self.fc_layer(ac1, 600, "fc2")   
         ac2 = tf.nn.relu(fc2)
-#        fc2_drop = tf.nn.dropout(ac2, 0.1)
         fc3 = self.fc_layer(ac2, 200, "fc3")
         return fc1,fc2,fc3
     
@@ -56,12 +51,9 @@ def xavier_init(self,n_inputs, n_outputs, uniform=True):
 
     def fc_layer(self, bottom, n_weight, name):
         print( bottom.get_shape())
-        assert len(bottom.get_shape()) == 2
         n_prev_weight = bottom.get_shape()[1]
-#        initer = tf.truncated_normal_initializer(stddev=0.01)
         initer = self.xavier_init(int(n_prev_weight),n_weight)
         W = tf.get_variable(name+'W', dtype=tf.float32, shape=[n_prev_weight, n_weight], initializer=initer)
-#        b = tf.get_variable(name+'b', dtype=tf.float32, initializer=tf.constant(0.01, shape=[n_weight], dtype=tf.float32))
         b = tf.get_variable(name+'b', dtype=tf.float32, initializer=tf.random_uniform([n_weight],-0.001,0.001, dtype=tf.float32))
         fc = tf.nn.bias_add(tf.matmul(bottom, W), b)
         return fc
diff --git a/scripts/siamese_model.py~ b/scripts/siamese_model.py~