SlideShare a Scribd company logo
An Unconstrained Dataset for
Non-stationary Video Based Fire
Detection
Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho
Latin American Robotics Symposium (LARS)
Federal University of Rio Grande – FURG
Computational Sciences Center – C3
October 2015
Motivation I
“Proprietary ground truth data is a barrier to independent
evaluation of metrics and algorithms”
Krig, 2014
Motivation II
First publicaly available non-stationary dataset
First publicaly available dataset that is annotated
About
Source: TheBackyardScientist at https://youtu.be/FvLfDpTONNk
A brief overview on the state-of-the-art
 Phillips (2002)
 Chen (2004)
 Toreyin (2005)
 Çelik (2007, 2008, 2010)
 Li (2011, 2012)
 Kolesov (2010)
 Mueller (2013)
A brief overview on the state-of-the-art
 Borges (2010)
 Chenebert (2011)
Our contribution
• An algorithm to find correspondences between a fire
detector output and the annotated fire regions;
• Two separated rigorous and precise methods for evaluating
any algorithms performance on the proposed
dataset.
o Fire location;
o Frame-by-frame classification;
• C++ source code that implements these procedures.
About the Videos
• 24 videos
• 28k frames (51.37% contain fire)
• 17k annotated regions
• Creative Commons 3.0 license
About the Videos
• Variety of fire sources
• Uneven illumination
• Camera movement
• Different color accuracy settings
• Clutter
• Partial Occlusion
• Motion blur
• Scale and projection
• Reflection
About the Annotations
• Rectangle that embraces the whole fire region
• Very small fire sparkles left out
• A fire-frame may present one or more annotations
• XML files
(each video file has its corresponding annotation file)
• Average flame area is 61512px
(aprox. 250×250px square)
• Fire region size/frame size = 8,92%
About the Annotations
Frame-by-frame metrics
• Recall
• Specificity
• Precision
• Negative Predictive Value
• Fall-out
Frame-by-frame metrics
• False Discovery rate
• False Negative rate
• Accuracy
• F1 Score
• Matthews Correlation Coeficient
Location-based metrics
• Considers 1-N relations;
• Metrics:
o Precision
o Recall
o Mean Similarity
Using it!
Frame by frame results
Metrics Çelik (2010) Zhou (2010) Chenebert (2011)
TPR 0.739 0.987 0.990
SPC 0.317 0.022 0.724
PPV 0.654 0.638 0.857
NPV 0.410 0.501 0.979
FPR 0.682 0.977 0.275
FDR 0.345 0.361 0.142
FNR 0.260 0.012 0.009
ACC 0.585 0.635 0.890
F1 Score 0.694 0.775 0.919
MCC 0.060 0.036 0.773
Location Based Results
Metrics Çelik (2010) Zhou (2010) Chenebert (2011)
PPV 0.251 0.019 0.832
TPR 0.732 0.440 0.979
F1 Score 0.384 0.037 0.902
S 0.250 0.020 0.801
An Unconstrained Dataset for
Non-stationary Video Based Fire
Detection
Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho
Latin American Robotics Symposium (LARS)
Federal University of Rio Grande – FURG
Computational Sciences Center – C3
October 2015

More Related Content

PPTX
impervious cover
PPTX
3. Work Organization
PDF
Calibrations_Poster
PDF
Practical Digital Image Processing 1
PPTX
Object extraction from satellite imagery using deep learning
PDF
End-to-End Object Detection with Transformers
PPTX
Detecting solar farms with deep learning
PDF
Object Detection and Recognition
impervious cover
3. Work Organization
Calibrations_Poster
Practical Digital Image Processing 1
Object extraction from satellite imagery using deep learning
End-to-End Object Detection with Transformers
Detecting solar farms with deep learning
Object Detection and Recognition

What's hot (10)

PPTX
Open Backscatter Toolchain (OpenBST) Project - A Community-vetted Workflow fo...
PDF
AI and Deep Learning for On-Board Satellite Image Analysis, OW2con'19, June 1...
 
PDF
MediaEval 2015 - CERTH at MediaEval 2015 Synchronization of Multi-User Event ...
PDF
Data analysis for effective monitoring of partially shaded residential PV system
PDF
MediaEval 2015 - JRS at Synchronization of Multi-user Event Media Task
PPTX
NASA's Movement Towards Cloud Computing
PDF
MediaEval 2015 - Synchronization of Multi-User Event Media at MediaEval 2015:...
PDF
15 sengupta next_generation_satellite_modelling
PPTX
Mask R-CNN
PDF
Combining remote sensing earth observations and in situ networks: detection o...
Open Backscatter Toolchain (OpenBST) Project - A Community-vetted Workflow fo...
AI and Deep Learning for On-Board Satellite Image Analysis, OW2con'19, June 1...
 
MediaEval 2015 - CERTH at MediaEval 2015 Synchronization of Multi-User Event ...
Data analysis for effective monitoring of partially shaded residential PV system
MediaEval 2015 - JRS at Synchronization of Multi-user Event Media Task
NASA's Movement Towards Cloud Computing
MediaEval 2015 - Synchronization of Multi-User Event Media at MediaEval 2015:...
15 sengupta next_generation_satellite_modelling
Mask R-CNN
Combining remote sensing earth observations and in situ networks: detection o...
Ad

Similar to An Unconstrained Dataset for Non-stationary Video Based Fire Detection (20)

PDF
O045078588
PDF
PDF
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
PDF
A novel pairwise based convolutional neural network for image preprocessing e...
PDF
Ai4103203205
PDF
IRJET- A Hybrid Approach for Fire Safety Intensives Automatic Assistance ...
PDF
Survey On Various Fire Detection Methods
PDF
IRJET- Fire Detection using Infrared Images for Uav-Based Forest Fire Sur...
PDF
Forest Fire Detection Using Deep Learning and Image Recognition
PDF
An automatic flame detection system for outdoor areas
PPTX
Research Project Presentation
PDF
Fire and Smoke Detection for Wildfire using YOLOV5 Algorithm
PDF
Flame and smoke estimation for fire detection in videos based on optical flow...
PDF
Fire detection using deep learning methods
PDF
Survey of local binary pattern for fire & smoke using
PDF
Survey of local binary pattern for fire & smoke using wavelet decomposition
PDF
Comparison of two deep learning methods for detecting fire hotspots
PPTX
FIRE DETECTION USING VIDEO ANALYTICS
PDF
"End to End Fire Detection Deep Neural Network Platform," a Presentation from...
PPTX
Research and implementation of smoke detection in video streams naveedakram@...
O045078588
Fire Detection on Unconstrained Videos Using Color-Aware Spatial Modeling and...
A novel pairwise based convolutional neural network for image preprocessing e...
Ai4103203205
IRJET- A Hybrid Approach for Fire Safety Intensives Automatic Assistance ...
Survey On Various Fire Detection Methods
IRJET- Fire Detection using Infrared Images for Uav-Based Forest Fire Sur...
Forest Fire Detection Using Deep Learning and Image Recognition
An automatic flame detection system for outdoor areas
Research Project Presentation
Fire and Smoke Detection for Wildfire using YOLOV5 Algorithm
Flame and smoke estimation for fire detection in videos based on optical flow...
Fire detection using deep learning methods
Survey of local binary pattern for fire & smoke using
Survey of local binary pattern for fire & smoke using wavelet decomposition
Comparison of two deep learning methods for detecting fire hotspots
FIRE DETECTION USING VIDEO ANALYTICS
"End to End Fire Detection Deep Neural Network Platform," a Presentation from...
Research and implementation of smoke detection in video streams naveedakram@...
Ad

More from Cristiano Rafael Steffens (20)

PDF
CONVOLUTIONAL NEURAL NETWORKS: The workhorse of image and video
PPTX
A pipelined approach to deal with image distortion in computer vision - BRACI...
PPTX
A CNN BASED MODEL TO RESTORE ILL EXPOSED IMAGES
PDF
Can Exposure, Noise and Compression affect Image Recognition? An Assessment o...
PPTX
MODELAGEM DAS DINÂMICAS DA FORMAÇÃO DA GOTA E TRANSFERÊNCIA DE MASSA EM PROCE...
PPTX
UMA ABORDAGEM COMPARATIVA ENTRE MICROCONTROLADORES: ARDUINO MEGA X ARDUINO DU...
PPTX
FPGA-based sensor integration and communication protocols for automated
PPTX
Lars 2016 A Texture Driven Approach for Visible Spectrum Fire Detection
PDF
Php Math and arrays
PPTX
ICRA 2016 - Interactive section Presentation
PDF
Vision-Based System for Welding Groove Measurements for Robotic Welding Appli...
PPT
Simpósio Unicruz: OpenCV + Python (parte 1)
PPTX
Welding Groove Mapping: Image Acquisition and Processing on Shiny Surfaces - ...
PPTX
Automated control module based on VBM for shipyard welding applications: Stud...
PPTX
Introdução ao processamento de imagens com OpenCV (cont)
PPTX
Introdução OpenCV (Pt-Br) com exemplos
PPTX
Um Sistema De Detecção De Fogo Baseado Em Vídeo
PPTX
Um sistema de detecção de chamas utilizando RF e SVM (Short Version)
PPT
G xserver curso-actualizgxxev1
PDF
20 pratico cursogxxbr
CONVOLUTIONAL NEURAL NETWORKS: The workhorse of image and video
A pipelined approach to deal with image distortion in computer vision - BRACI...
A CNN BASED MODEL TO RESTORE ILL EXPOSED IMAGES
Can Exposure, Noise and Compression affect Image Recognition? An Assessment o...
MODELAGEM DAS DINÂMICAS DA FORMAÇÃO DA GOTA E TRANSFERÊNCIA DE MASSA EM PROCE...
UMA ABORDAGEM COMPARATIVA ENTRE MICROCONTROLADORES: ARDUINO MEGA X ARDUINO DU...
FPGA-based sensor integration and communication protocols for automated
Lars 2016 A Texture Driven Approach for Visible Spectrum Fire Detection
Php Math and arrays
ICRA 2016 - Interactive section Presentation
Vision-Based System for Welding Groove Measurements for Robotic Welding Appli...
Simpósio Unicruz: OpenCV + Python (parte 1)
Welding Groove Mapping: Image Acquisition and Processing on Shiny Surfaces - ...
Automated control module based on VBM for shipyard welding applications: Stud...
Introdução ao processamento de imagens com OpenCV (cont)
Introdução OpenCV (Pt-Br) com exemplos
Um Sistema De Detecção De Fogo Baseado Em Vídeo
Um sistema de detecção de chamas utilizando RF e SVM (Short Version)
G xserver curso-actualizgxxev1
20 pratico cursogxxbr

Recently uploaded (20)

PDF
Formation of Supersonic Turbulence in the Primordial Star-forming Cloud
PPTX
famous lake in india and its disturibution and importance
PDF
The scientific heritage No 166 (166) (2025)
PPTX
Taita Taveta Laboratory Technician Workshop Presentation.pptx
PPT
POSITIONING IN OPERATION THEATRE ROOM.ppt
PDF
Placing the Near-Earth Object Impact Probability in Context
PPTX
7. General Toxicologyfor clinical phrmacy.pptx
PDF
. Radiology Case Scenariosssssssssssssss
PPTX
Classification Systems_TAXONOMY_SCIENCE8.pptx
PPTX
Cell Membrane: Structure, Composition & Functions
PPTX
G5Q1W8 PPT SCIENCE.pptx 2025-2026 GRADE 5
PPTX
Introduction to Cardiovascular system_structure and functions-1
PPTX
2. Earth - The Living Planet earth and life
PPTX
ANEMIA WITH LEUKOPENIA MDS 07_25.pptx htggtftgt fredrctvg
PPTX
Comparative Structure of Integument in Vertebrates.pptx
PDF
Sciences of Europe No 170 (2025)
PPTX
2Systematics of Living Organisms t-.pptx
PDF
Phytochemical Investigation of Miliusa longipes.pdf
PPTX
Derivatives of integument scales, beaks, horns,.pptx
PPTX
DRUG THERAPY FOR SHOCK gjjjgfhhhhh.pptx.
Formation of Supersonic Turbulence in the Primordial Star-forming Cloud
famous lake in india and its disturibution and importance
The scientific heritage No 166 (166) (2025)
Taita Taveta Laboratory Technician Workshop Presentation.pptx
POSITIONING IN OPERATION THEATRE ROOM.ppt
Placing the Near-Earth Object Impact Probability in Context
7. General Toxicologyfor clinical phrmacy.pptx
. Radiology Case Scenariosssssssssssssss
Classification Systems_TAXONOMY_SCIENCE8.pptx
Cell Membrane: Structure, Composition & Functions
G5Q1W8 PPT SCIENCE.pptx 2025-2026 GRADE 5
Introduction to Cardiovascular system_structure and functions-1
2. Earth - The Living Planet earth and life
ANEMIA WITH LEUKOPENIA MDS 07_25.pptx htggtftgt fredrctvg
Comparative Structure of Integument in Vertebrates.pptx
Sciences of Europe No 170 (2025)
2Systematics of Living Organisms t-.pptx
Phytochemical Investigation of Miliusa longipes.pdf
Derivatives of integument scales, beaks, horns,.pptx
DRUG THERAPY FOR SHOCK gjjjgfhhhhh.pptx.

An Unconstrained Dataset for Non-stationary Video Based Fire Detection

  • 1. An Unconstrained Dataset for Non-stationary Video Based Fire Detection Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho Latin American Robotics Symposium (LARS) Federal University of Rio Grande – FURG Computational Sciences Center – C3 October 2015
  • 2. Motivation I “Proprietary ground truth data is a barrier to independent evaluation of metrics and algorithms” Krig, 2014
  • 3. Motivation II First publicaly available non-stationary dataset First publicaly available dataset that is annotated
  • 4. About Source: TheBackyardScientist at https://youtu.be/FvLfDpTONNk
  • 5. A brief overview on the state-of-the-art  Phillips (2002)  Chen (2004)  Toreyin (2005)  Çelik (2007, 2008, 2010)  Li (2011, 2012)  Kolesov (2010)  Mueller (2013)
  • 6. A brief overview on the state-of-the-art  Borges (2010)  Chenebert (2011)
  • 7. Our contribution • An algorithm to find correspondences between a fire detector output and the annotated fire regions; • Two separated rigorous and precise methods for evaluating any algorithms performance on the proposed dataset. o Fire location; o Frame-by-frame classification; • C++ source code that implements these procedures.
  • 8. About the Videos • 24 videos • 28k frames (51.37% contain fire) • 17k annotated regions • Creative Commons 3.0 license
  • 9. About the Videos • Variety of fire sources • Uneven illumination • Camera movement • Different color accuracy settings • Clutter • Partial Occlusion • Motion blur • Scale and projection • Reflection
  • 10. About the Annotations • Rectangle that embraces the whole fire region • Very small fire sparkles left out • A fire-frame may present one or more annotations • XML files (each video file has its corresponding annotation file) • Average flame area is 61512px (aprox. 250×250px square) • Fire region size/frame size = 8,92%
  • 12. Frame-by-frame metrics • Recall • Specificity • Precision • Negative Predictive Value • Fall-out
  • 13. Frame-by-frame metrics • False Discovery rate • False Negative rate • Accuracy • F1 Score • Matthews Correlation Coeficient
  • 14. Location-based metrics • Considers 1-N relations; • Metrics: o Precision o Recall o Mean Similarity
  • 16. Frame by frame results Metrics Çelik (2010) Zhou (2010) Chenebert (2011) TPR 0.739 0.987 0.990 SPC 0.317 0.022 0.724 PPV 0.654 0.638 0.857 NPV 0.410 0.501 0.979 FPR 0.682 0.977 0.275 FDR 0.345 0.361 0.142 FNR 0.260 0.012 0.009 ACC 0.585 0.635 0.890 F1 Score 0.694 0.775 0.919 MCC 0.060 0.036 0.773
  • 17. Location Based Results Metrics Çelik (2010) Zhou (2010) Chenebert (2011) PPV 0.251 0.019 0.832 TPR 0.732 0.440 0.979 F1 Score 0.384 0.037 0.902 S 0.250 0.020 0.801
  • 18. An Unconstrained Dataset for Non-stationary Video Based Fire Detection Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho Latin American Robotics Symposium (LARS) Federal University of Rio Grande – FURG Computational Sciences Center – C3 October 2015

Editor's Notes

  • #3: First, let me talk a little about why this dataset was created. At FURG we are working on a surveillance robot. It follows a predetermined path, reconizes and tracks people, car plates, reports diferente kinds of incidentes AND one of its features is the fire detection using color images. It all started with frustration and anger! When I started the bibliography review I came accross many publications that did not provide a source code neither the dataset that has been used to evaluate it. In the same way, the evaluations were also nuclear, ignoring many importante metrics. It becomes very hard to evaluate a detector using only the recall or precision information.
  • #6: The majority of the previous video based fire detections systems is designed to work with stationary videos. Doing a survey on the research topic, we can quickly identify a pattern among the proposed solutions. They all combine, in a cascade/sequential mode a aquisition system, a color based pixel wise classification and the pulsation patterns. Geralmente utilizam-se câmeras fixas em torres de vigilância a partir das quais é obtido um stream de vídeo. A primeira parte do processo é a classificação individual, pixel-a-pixel da imagem definindo regiões com a coloração de fogo. A segunda etapa do processo varia entre os trabalhos estudados, partindo de uma abordagem que avalia apenas a variância individual de cada pixel conforme proposto em PHILLIPS (2002) até modelos baseados em fluxo óptico conforme proposto por MUELLER (2013).
  • #7: Dentre todas as publicações revisadas, as que mais se aproximam com os objetivos propostos no nosso trabalho são BORGES (2010) e CHENEBERT (2011). BORGES cria um modelo de aproximação estatística. Para a classificação de cor, aplica-se inicialmente um filtro gaussiano cujo desvio padrão (tamanho do filtro) é obtido a partir da variância em cada canal. Os valores de pixel, já suavizados, são utilizados para aplicação de um threshold que dá maior probabilidade para os pixels no centro da imagem. A classificação dos pixels pela cor permite definer regiões de interesse e extrair características. Borges propões o uso de informações da área, rugosidade do contorno, variância e inclinação no canal vermelho. A Classificação utilizando estes atributos é dada através de um classificador Naive Bayes. O trabalho foi publicado na IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY. Já o trabalho de CHENEBERT, apresentado na ICIP 2011 também se aproxima do trabalho proposto, ao tentar utilizar informações da textura para a classificação de regiões como fogo ou não fogo. A primeira etapa consiste na classificação dos pixels individualmente utilizando uma equação proposta por Chen(2004), que utiliza thresholds fixos. Para a classificação das regiões utiliza-se a extração de histogramas de 10 bins para os canais “Matiz” e “Saturação” do colorspace HSV resultando em 20 atributos. Ainda para a classificação das texturas os autores utilizam GLCM, também conhecidos como descritores de Haralick, extraindo energia, entropia, contraste, homoegeniedade e correlação dos valores de pixel em H e S. Cada região é então classificada com base nestes 30 atributos que são testados em um classificador de árvore e em uma rede neural. Os resultados obtidos mostram que o algorítmo CART é o que fornece os melhores resultados. Os autores tentaram ainda reduzir o números de atributos, de forma a encontrar os mais discriminantes, mas os rersultados mostraram que não houve uma melhora significativa.
  • #13: Quando o detector é avaliado frame a frame, pode-se avalia-lo da mesma forma que se avalia um classificador binários. Neste caso, os frames que contém fogo são considerados como 1’s e os frames sem fogo são considerados como 0’s. O recall, ou revocação, é a fração dos frames de fogo que foram corretamente classificados pelo detector. TPR = TP/P A especifidade é a medida análoga ao recall, mas aplicado aos frames que não apresentam fogo. SPC = TN/N A precisão é a métrica que mostra qual o percentual dos frames classificados como fogo pelo detector são realmente fogo. PPV = TP/ (TP+FP) Já o valor preditivo negativo, é o equivalente à precisão para aplicada às saídas negativas do detector. NPV = TN/(TN+FN) Já a métrica fall-out dá a razão dos falsos positivos para o total de negativos. FPR = FP/N Enquanto estas métricas nos permitem avaliar os resultados do detector individualmente, elas não oferecem medidas combinadas. Neste sentido, a acurácia pode ser útil ao fornecer a proporção dos frames que foram corretamente classificados. No entanto, não é uma métrica balanceada, podendo induzir ao erro, ao desconsiderar a matriz de confusão. A métrica F1 Score, proposta por Chinchor (1992), é a média harmônica entre a precisão e o recall. Por este motivo, a F1 Score tende a punir sistemas que que apresentem um desequilíbrio entre estas medidas. Já o coeficiente de correlação de Matheus é a correlação linear entre os resultados esperados e os resultados fornecidos pelo detector. A escala varia de -1 até 1, onde -1 representa correlação negativa, 0 é o equivalente à uma predição aleatória e 1 representa que os resultados obtidos são exatamente iguais aos esperados.
  • #14: Enquanto estas métricas nos permitem avaliar os resultados do detector individualmente, elas não oferecem medidas combinadas. Neste sentido, a acurácia pode ser útil ao fornecer a proporção dos frames que foram corretamente classificados. No entanto, não é uma métrica balanceada, podendo induzir ao erro, ao desconsiderar a matriz de confusão. A métrica F1 Score, proposta por Chinchor (1992), é a média harmônica entre a precisão e o recall. Por este motivo, a F1 Score tende a punir sistemas que que apresentem um desequilíbrio entre estas medidas. Já o coeficiente de correlação de Matheus é a correlação linear entre os resultados esperados e os resultados fornecidos pelo detector. A escala varia de -1 até 1, onde -1 representa correlação negativa, 0 é o equivalente à uma predição aleatória e 1 representa que os resultados obtidos são exatamente iguais aos esperados.
  • #15: As métricas frame a frame são, no entanto, incapazes de mensurar adequadamente se o detector encontrou corretamente as regiões que apresentam chama na imagem. Por este motivo utilizaram-se também métricas de avaliação da localização das chamas detectadas. Levou-se em consideração que pode existir uma relação 1 para N, onde várias saídas do detector podem ser associadas à uma única anotação de ground-truth. Neste caso, é possível calcular somente as métricas que não dependem de valores negativos, o que inclui a precisão, recall e similaridade média. Na avaliação, a função de similaridade é dada pela intersecção da área detectada com a anotação de groundtruth correspondente, dividido pela área da detecção. Neste caso, sempre que a região detectada não extrapolar a região anotada, a similaridade é igual a 1. S = (Dt intersec Gt)/ Dt