huggingface/diffusers

Fork 0

mirror of https://github.com/huggingface/diffusers.git synced 2026-06-02 00:01:34 +08:00

Files

Steven Liu cc5b31ffc9

Run dependency tests / check_dependencies (push) Waiting to run

Details

Run Torch dependency tests / check_torch_dependencies (push) Waiting to run

Details

Fast GPU Tests on main / Setup Torch Pipelines CUDA Slow Tests Matrix (push) Waiting to run

Details

Fast GPU Tests on main / Torch Pipelines CUDA Tests (push) Blocked by required conditions

Details

Fast GPU Tests on main / Torch CUDA Tests (lora) (push) Waiting to run

Details

Fast GPU Tests on main / Torch CUDA Tests (models) (push) Waiting to run

Details

Fast GPU Tests on main / Torch CUDA Tests (others) (push) Waiting to run

Details

Fast GPU Tests on main / Torch CUDA Tests (schedulers) (push) Waiting to run

Details

Fast GPU Tests on main / Torch CUDA Tests (single_file) (push) Waiting to run

Details

Fast GPU Tests on main / PyTorch Compile CUDA tests (push) Waiting to run

Details

Fast GPU Tests on main / PyTorch xformers CUDA tests (push) Waiting to run

Details

Fast GPU Tests on main / Examples PyTorch CUDA tests on Ubuntu (push) Waiting to run

Details

Fast tests on main / ${{ matrix.config.name }} (map[framework:pytorch image:diffusers/diffusers-pytorch-cpu name:Fast PyTorch CPU tests on Ubuntu report:torch_cpu runner:aws-general-8-plus]) (push) Waiting to run

Details

Fast tests on main / ${{ matrix.config.name }} (map[framework:pytorch_examples image:diffusers/diffusers-pytorch-cpu name:PyTorch Example CPU tests on Ubuntu report:torch_example_cpu runner:aws-general-8-plus]) (push) Waiting to run

Details

Secret Leaks / trufflehog (push) Waiting to run

Details

Update Diffusers metadata / update_metadata (push) Waiting to run

Details

Build documentation / build (push) Has been cancelled

Details

[docs] Migrate syntax (#12390 )

* change syntax

* make style

2025-09-30 10:11:19 -07:00

1.4 KiB

Raw Blame History

Quantization

Quantization techniques reduce memory and computational costs by representing weights and activations with lower-precision data types like 8-bit integers (int8). This enables loading larger models you normally wouldn't be able to fit into memory, and speeding up inference.

Tip

Learn how to quantize models in the Quantization guide.

PipelineQuantizationConfig

autodoc quantizers.PipelineQuantizationConfig

BitsAndBytesConfig

autodoc quantizers.quantization_config.BitsAndBytesConfig

GGUFQuantizationConfig

autodoc quantizers.quantization_config.GGUFQuantizationConfig

QuantoConfig

autodoc quantizers.quantization_config.QuantoConfig

TorchAoConfig

autodoc quantizers.quantization_config.TorchAoConfig

DiffusersQuantizer

autodoc quantizers.base.DiffusersQuantizer

1.4 KiB Raw Blame History

Quantization

PipelineQuantizationConfig

BitsAndBytesConfig

GGUFQuantizationConfig

QuantoConfig

TorchAoConfig

DiffusersQuantizer

1.4 KiB

Raw Blame History