FedWSQ: Efficient Federated Learning with WS and DANUQ

This repository is the official implementation of ICCV 2025 paper "FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization"

By Seung-Wook Kim, Seong-yeol Kim, Jiah Kim, Seowon Ji and Se-Ho Lee

Federated learning (FL) often suffers from performance degradation due to key challenges such as data heterogeneity and communication constraints. To address these limitations, we present a novel FL framework called FedWSQ, which integrates weight standardization~(WS) and the proposed distribution-aware non-uniform quantization~(DANUQ). WS enhances FL performance by filtering out biased components in local updates during training, thereby improving the robustness of the model against data heterogeneity and unstable client participation. In addition, DANUQ minimizes quantization errors by leveraging the statistical properties of local model updates. As a result, FedWSQ significantly reduces communication overhead while maintaining superior model accuracy. Extensive experiments on FL benchmark datasets demonstrate that FedWSQ consistently outperforms existing FL methods across various challenging FL settings, including extreme data heterogeneity and ultra-low-bit communication scenarios.

Installation

⚙ Dependencies

We have exported all required dependencies into fedwsq.yaml.
You can create the environment by running:

git clone https://github.com/gymlab/FedWSQ.git
conda env create -f fedwsq.yaml
conda activate fedwsq

🗂 Dataset

CIFAR-10 & CIFAR-100 will be downloaded automatically.
Tiny-ImageNet must be downloaded manually and unpacked into the ./data/ directory.

FedWSQ (this repository)
   └── data (automatically created)
      ├── cifar-10-python.tar.gz
      ├── cifar-100-python.tar.gz
      └── tiny-imagenet-200.zip

🛠️ Arguments

The following arguments can be adjusted to customize experiments (default is bold):

Argument	Options
`--model`	`resnet18` , `resnet18_WS`
`--dataset`	`cifar10` , `cifar100`, `tinyimagenet`
`--batch_size`	`50` , `100`, `...`
`--quantizer.momentum`	`0.1` , `0.2` , `...`
`--quantizer.wt_bit`	`1`, `4`, `...`
`--quantizer.random_bit`	`none` , `fixed_alloc` , `rand_alloc`
`--trainer.num_clients`	`100` , `500` , `...`
`--trainer.participation_rate`	`0.02`, `0.05`, `...`
`--split.mode`	`dirichlet`, `iid`
`--split.alpha`	`0.03`, `0.05`, `0.1`, `0.3` , `0.6`, `...`

⚠️ Note

Batch Size: --batch_size=50 for CIFAR datasets, --batch_size=100 for Tiny-ImageNet.
The --quantizer.momentum corresponds to the momentum β used for updating the scaling vector.
To enable Fixed-Bit Allocation (FBA), set --quantizer.random_bit=fixed_alloc.
To enable Dynamic-Bit Allocation (DBA), set --quantizer.random_bit=rand_alloc.
When --quantizer.random_bit is set to fixed_alloc or rand_alloc, --quantizer.wt_bit is ignored.
When --split.mode=iid, --split.alpha is ignored.

📌 Quick Start

ResNet18_WS, CIFAR-10, 4bits, 100 clients, 5% participation, Dirichlet (0.3) split (default)

python federated_train.py model=resnet18_WS dataset=cifar10 batch_size=50 quantizer=WSQ quantizer.momentum=0.1 quantizer.random_bit=none quantizer.wt_bit=4 trainer.num_clients=100 trainer.participation_rate=0.05 split.mode=dirichlet split.alpha=0.3

ResNet, CIFAR-10, FBA(2.33bits), 100 clients, 5% participation, Dirichlet (0.1) split

python federated_train.py model=resnet18 dataset=cifar10 batch_size=50 quantizer=WSQ quantizer.momentum=0.1 quantizer.random_bit=fixed_alloc trainer.num_clients=100 trainer.participation_rate=0.05 split.mode=dirichlet split.alpha=0.1

ResNet18_WS, CIFAR-100, DBA(2.33bits), 500 clients, 2% participation, Dirichlet (0.3) split

python federated_train.py model=resnet18_WS dataset=cifar100 batch_size=50 quantizer=WSQ quantizer.momentum=0.1 quantizer.random_bit=rand_alloc trainer.num_clients=500 trainer.participation_rate=0.02 split.mode=dirichlet split.alpha=0.3

ResNet, Tiny-ImageNet, 1bits, 100 clients, 5% participation, iid split

python federated_train.py model=resnet18 dataset=tinyimagenet batch_size=100 quantizer=WSQ quantizer.momentum=0.1 quantizer.random_bit=none quantizer.wt_bit=1 trainer.num_clients=100 trainer.participation_rate=0.05 split.mode=iid

References

📚 Citation

If you find this work useful for your research, please cite our paper:

@misc{kim2025fedwsq,
      title={FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization}, 
      author={Seung-Wook Kim and Seongyeol Kim and Jiah Kim and Seowon Ji and Se-Ho Lee},
      year={2025},
      eprint={2506.23516},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/2506.23516}, 
}

🙏 Acknowledgement

This code is built based on FedACG. Thanks to the authors for their great contribution!

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
assets		assets
client_data		client_data
clients		clients
configs		configs
datasets		datasets
evalers		evalers
models		models
servers		servers
trainers		trainers
utils		utils
.gitignore		.gitignore
README.md		README.md
exp_fedavgwsq.sh		exp_fedavgwsq.sh
federated_train.py		federated_train.py
fedwsq.yaml		fedwsq.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FedWSQ: Efficient Federated Learning with WS and DANUQ

Installation

⚙ Dependencies

🗂 Dataset

🛠️ Arguments

📌 Quick Start

References

📚 Citation

🙏 Acknowledgement

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

FedWSQ: Efficient Federated Learning with WS and DANUQ

Installation

⚙ Dependencies

🗂 Dataset

🛠️ Arguments

📌 Quick Start

References

📚 Citation

🙏 Acknowledgement

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages