broadcast_tensor in core_vq.py for multi_gpu training

https://github.com/ZhangXInFD/SpeechTokenizer/blob/30c96fb32a9fc06a2258c98119e237def051e46c/speechtokenizer/quantization/core_vq.py#L139-L149


In core_vq.py, broadcasting tensor function is commented, which is different from the original code [facebookresearch/encodec](https://github.com/facebookresearch/encodec) 

According to the original author of encodec, this broadcasting seems to required for multi-gpu training.
Have you been tested and compared the encodec model trained w/ or w/o broadcasting function?

	def init_embed_(self, data):
	if self.inited:
	return

	embed, cluster_size = kmeans(data, self.codebook_size, self.kmeans_iters)
	self.embed.data.copy_(embed)
	self.embed_avg.data.copy_(embed.clone())
	self.cluster_size.data.copy_(cluster_size)
	self.inited.data.copy_(torch.Tensor([True]))
	# Make sure all buffers across workers are in sync after initialization
	#broadcast_tensors(self.buffers())

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

broadcast_tensor in core_vq.py for multi_gpu training #24

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

broadcast_tensor in core_vq.py for multi_gpu training #24

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions