SemiCOL-Challenge

SemiCOL Challenge 2023 - Semi-supervised learning for colorectal cancer detection

Create environment:

Create conda env:

conda create --name semicol python=3.8 pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
source activate semicol

Install requirements:

pip install -r requirements.txt

Run instructions:

Patch and create .h5 from training dataset:

python3 create_dataset.py \
        --manual_path="/home/data/semicol/DATASET_TRAIN/01_MANUAL/" \
        --output="/home/data/semicol/DATASET_TRAIN/semicol.h5"

Stain normalisation:

python3 create_h5_stain_norm.py \
        --h5-location="/home/data/semicol/DATASET_TRAIN/semicol.h5" \
        --normalisation-type="Macenko" \
        --target-image="/home/cggm1/data/semicol/DATASET_TRAIN/01_MANUAL/DS_M_1/ukk_case_04/image/ukk_case_04 [d=2.16945,x=91117,y=78100,w=6508,h=6509].png"

Train model:

CUDA_VISIBLE_DEVICES=0 python3 train.py \
        --data_path="/home/cggm1/data/semicol/DATASET_TRAIN_mini/semicol_mini.h5" \
        --architecture=unet \
        --batch_size=128 \
        --classes=10 \
        --epochs=5 \
        --index_to_ignore=0 \
        --learning_rate=0.0001 \
        --normalise=False --optim_type=adam \
        --patch_dim=256 \
        --weights=rebalanced \
        --amp \
        --class_reduce=True

Model inference (segmentation):

CUDA_VISIBLE_DEVICES=0 python3 validation_inference_part_1.py \
        --input="/home/cggm1/data/semicol_docker/input/01_MANUAL" \
        --output="/home/cggm1/data/semicol/DATASET_VAL/docker/" \
        --model_path="/home/cggm1/data/semicol/checkpoints/unet/rebalanced/256/drb8at9y/checkpoint_epoch34.pth" \
        --architecture="unet"
        
#working example below

CUDA_VISIBLE_DEVICES=0 python3 validation_inference_part_1.py --input="/home/cggm1/data/semicol_docker/input/01_MANUAL" --output="/home/cggm1/data/semicol_docker/pred" --model_path="/home/cggm1/data/semicol/checkpoints/unet/rebalanced/256/mjdx91bl/checkpoint_epoch5.pth" --architecture="unet"

Model inference (Tumour classification):

First, generate a list of patches:

python3 create_patches.py --source="/home/cggm1/data/semicol_docker/input/02_BX/" --save_dir="/dir/to/save/h5/sets/" --preset="semicol.csv" --patch

Note: If the above does not run with the current environment, create a new temprary conda env with python=3.8 using conda create -n patching python=3.8 then run python -m pip install -U tifffile[all] inside that environment.

Then, use the list of generated patches to get a slide level classification

CUDA_VISIBLE_DEVICES=0 python3 validation_inference_part_2_01.py \
        --coords="./patches/" \
        --input_data="/home/cggm1/data/semicol_docker/input/02_BX" \
        --model_path="/home/cggm1/data/semicol/checkpoints/unet/rebalanced/256/drb8at9y/checkpoint_epoch34.pth" \
        --num_classes=10

Finally, convert class count metrics to slide level classification:

python3 validation_inference_part_2_02.py

You may wish to make adjustments to the thresholds in this file in order to optimise classification performance.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
trained_models		trained_models
unet		unet
unet3plus		unet3plus
utils		utils
vit		vit
wsi_core		wsi_core
LICENSE		LICENSE
README.md		README.md
create_dataset.py		create_dataset.py
create_h5_stain_norm.py		create_h5_stain_norm.py
create_patches.py		create_patches.py
evaluate_crop.py		evaluate_crop.py
requirements.txt		requirements.txt
train.py		train.py
validation_inference_part_1.py		validation_inference_part_1.py
validation_inference_part_2_01.py		validation_inference_part_2_01.py
validation_inference_part_2_02.py		validation_inference_part_2_02.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SemiCOL-Challenge

Create environment:

Create conda env:

Install requirements:

Run instructions:

Patch and create .h5 from training dataset:

Stain normalisation:

Train model:

Model inference (segmentation):

Model inference (Tumour classification):

About

Releases

Packages

Languages

License

CraigMyles/SemiCOL-Challenge

Folders and files

Latest commit

History

Repository files navigation

SemiCOL-Challenge

Create environment:

Create conda env:

Install requirements:

Run instructions:

Patch and create .h5 from training dataset:

Stain normalisation:

Train model:

Model inference (segmentation):

Model inference (Tumour classification):

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages