Hikvision
E-bülten Kayıt

Derin Öğrenme, Güvenlik Sektörüne Nasıl Fayda Sağlar

June 9, 2017 Views:82

Güvenlik sektöründeki veridepolama cihazları rutin olarak muazzam sayıda ve çok katmanlı ham veri işlemekdurumunda kalmaktadırlar. Çeşitli boyutlardaki Güvenli Kent projeleriningiderek yaygınlaşmasıyla birlikte gözetim ağlarının sayısı da yüz binlerceyibulmuştur. Genellikle yüksek-çözünürlüklü ekranların tercih edilmesinden ötürü,güvenlik izleme sürecinde yer alan veri miktarı da kısa süre içerisinde ciddibir artış kaydetmiştir. Verilerin etkin biçimde toplanması, analiz edilmesi,uygulamaya konması ve akılcı bir şekilde kullanılması artık çok daha önemlidir.Dolayısıyla, video zekasının geliştirilmesi de sektör genelinde kaçınılmaz birhedef haline gelmiştir.

 

Güvenlik sistemi kullanıcıları, yeni ürünlere yapmış olduklarıyatırımların, ilgili kişilerin izlenmesi ve takibinin ötesinde, bir güvenlikolayı sonrasında delil toplanması sürecinde de faydalı olması beklentisiiçindeler. Daha önceleri büyük oranda insan gücüne dayalı olan güvenlikkamerası kayıtlarının aranması, olağan dışı verilerin tespiti, olay sonrasıtakip sürecindense olay anı -hatta olay öncesi- uyarılarının takibi gibisüreçlerine ağırlık verilmesinde yüksek teknolojiden faydalanılması, bahsedilenbu ekstra faydalara verilebilecek örneklerden birkaçıdır. Bu taleplerikarşılayabilmek için yeni teknolojilere ihtiyaç duyulmaktadır. Akıllı videoizleme mekanizmaları uzun yıllardır mevcut olmakla birlikte, uygulamaaşamasında çok da başarılı sonuçlar vermemişlerdir. Derin öğrenmenin ortayaçıkmasıyla birlikte bu talepler gerçeğe dönüşmüştür.

 

Geleneksel Zeka Algoritmalarının Yetersizliği

 

Geleneksel video izleme sürecinde, bir görüntünün arka planı için oldukçasıkı gereklilikler söz konusudur. Akıllı tanıma ve analiz sürecinin benzerdurumlardaki doğruluğu değişkenlik göstermektedir. Bunun temel sebebi,geleneksel video analiz algoritmalarının pek çok kusuru olmasıdır.

İnsan yüzü tanıma gibi bir akıllı tanıma ve analiz sürecinde, iki aşamayaihtiyaç vardır. İlk aşamada özellikler çıkartılır, ikinci aşamada ise“sınıflandırma öğrenmesi” gerçekleştirilir.

 

Bu ilk adımda elde edilecek doğruluk oranı, algoritmanın doğruluk oranınıbelirler. Sistem hesaplama ve test işlemlerinin büyük bir kısmı bu adımdagerçekleştirilir. Geleneksel akıllı algoritmaların özellikleri insanlartarafından belirlendiğinden, çoğunlukla özneldir. Daha soyut özellikler ise –kişilerin anlamada ya da anlatmada zorlandıkları – kaçırılmış olur. Değişen açıve ışıklar söz konusu olduğundan, özellikle de numune boyutu çok büyükolduğunda, birçok özelliği yakalamak son derece güçleşir. Bu nedenle,geleneksel zeka algoritmaları, belirli birtakım ortamlarda iyi bir performansgösterse de, ortaya çıkan küçük değişiklikler (görüntü kalitesi, çevre vb.)doğruluk açısından oldukça ciddi problemler doğurabilmektedir.

 

İkinci aşama olan sınıflandırma öğrenmesi, temel olarak hedef tespiti veözellik tanımayı içermektedir. Sınıflandırmaya uygun kategori sayısı arttıkça,güçlük derecesi de artar. Bu nedenle, geleneksel zeka analizi teknolojileriaraç analizinde son derece doğru sonuçlar vermekle beraber, insan ve nesneanalizinde aynı başarıyı yakalayamamaktadır. Örneğin araç tespitinde,araç/araç-değil şeklinde bir ayrım söz konusudur. Bu açıdan sınıflandırma da kolayolup, güçlük derecesi düşüktür. Araç özelliklerinin tanınması için farklı araçtasarımları, logolar ve diğer benzeri işaretlerin tanınması gerekir. Ancakbunlardan kısmen az sayıda olduğundan, sınıflandırma sonuçları genellikle doğruçıkmaktadır. İnsan yüzünde tanıma yapıldığında ise, her insan başlı başına birsınıflandırma olduğundan, birbiriyle eşleşen kategori sayısı da çok fazlaolacaktır – bu da, güçlük derecesinin çok yüksek olmasına yol açar.

 

Geleneksel zeka algoritmaları, karmaşık sınıflandırmalarda çok sayıdaveriyle çalışılması gereken durumlarda genellikle sığ öğrenme modellerinikullanır. Bu süreçte elde edilen analiz sonuçları, ideallikten çok uzaktır.Ayrıca bu sonuçlar, zeka uygulamalarının genişliği ve derinliği ile gelişimleriüzerinde de kısıtlayıcı etkiye sahiptir. Bu nedenle, güvenlik sektöründe büyükveriler söz konusu olduğunda zekanın “derinliğini” arttırma ihtiyacı da giderekartmaktadır.

 

Derin Öğrenmenin Avantajları ve Algoritmaları

 

Geleneksel zeka algoritmaları insanlar tarafından tasarlanmaktadır. Butasarımların iyi olup olmadığı ise büyük oranda deneyime, hatta şansa dayalıolup, bu süreç oldukça zaman alıcıdır. O halde, makinelerin, özelliklerdenyalnızca birkaçını bile otomatik olarak öğrenmelerini sağlamak mümkün müdür?Evet! Esasen Yapay Zekanın (AI) temel hedefi budur.

 

Derin öğrenme motivasyonu, insan beyninin sinir ağlarından gelir. Beynimiz,son derece karmaşık bir öğrenme modeli olarak düşünülebilir. Beyin sinirağları, birbirine bağlı milyarlarca sinir hücresinden oluşmaktadır; derinöğrenme de bu yapıyı destekler. Bu çok-katmanlı ağlar bilgiyi toplayarak ilgilihareketleri yerine getirebilirler. Ayrıca, nesne soyutlama ve yeniden yaratmayeteneğine de sahiptirler.

 

Derin öğrenme içsel olarak diğer algoritmalardan farklıdır. Gelenekselalgoritmaların yetersizliklerini nasıl çözümlediği, aşağıda verilmiştir.

  

Derin öğrenmenin algoritmik modeli, geleneksel 3-katmanlı algoritmayapılarından çok daha derin bir yapıya sahiptir. Katmanların sayısı bazen yüzügeçebilmekte ve karmaşık sınıflandırmalarda çok sayıda veriyi işlemesine olanakverebilmektedir. Derin öğrenme, insanın öğrenme sürecine son derece benzer vekatman-katman özellik-soyutlama süreci vardır. Her katmanda farklı bir“ağırlıklandırma” mevcut olup, bu ağırlıklandırma, görüntü ‘bileşenleri’nden neöğrenildiğini yansıtır. Katman düzeyi yükseldikçe, bileşenler daha belirli halegelir. Derin öğrenmede, insan beynini harekete geçiren orijinal uyarı, süreçkatmanlarından geçer; ardından, kısmi algılamayı (sığ) objeyialgılayabileceğimiz genel soyutlamaya (derin) götürür.



İkinci olarak, “Yapay Özellikler”den “Özellik Öğrenme”ye

 

Derin öğrenmede manuel müdahaleye gerek olmayıp, özellikleri çıkartacak birbilgisayara ihtiyaç duyulmaktadır. Bu şekilde, anlatması güç hatta imkansızolan soyut özellikler de dahil olmak üzere hedeften mümkün olduğunca fazlaözellik çıkartılabilmektedir. Özellik sayısı arttıkça, tanıma vesınıflandırmanın doğruluk oranı da o derece artmaktadır. Derin öğrenmealgoritmalarının en belirgin etkilerinden bazıları; insana dayalı tanımadoğruluğu oranlarına benzer hatta ondan daha iyi sonuçların elde edilmesi, güçlüparazit-giderici etki, binlerce özelliği tanıma ve sınıflandırma yeteneğidir.

 

Derin Öğrenmenin Temel Unsurları

 

Derin öğrenmenin çok daha önceleri değil de son yıllarda popüler halegelmesinin üç temel sebebi vardır: ilgili verilerin ölçeği, hesaplama gücü veağ yapısı.

 

Veriye dayalı algoritma performansında ortaya çıkan gelişmeler, kısa birzaman içerisinde çeşitli zeka uygulamalarında derin öğrenmeye hızkazandırmıştır. Özellikle de veri ölçeğinde görülen artışla birlikte algoritmaperformansı da gelişmiştir. Bu doğrultuda, kullanıcı deneyimi iyileşmiş ve dahafazla sayıda kullanıcı sürece katılarak daha büyük bir veri ölçeğini desteklerhale gelmiştir.

 

Video izlemi, büyük verinin %60’ını oluşturmakta olup bu miktar da her yıl%20 artış göstermektedir. Bu başarının hızı ve ölçeği, yüksek çözünürlüklüvideo izlemine bağlıdır – HD 1080p her geçen gün daha da yaygınlaşmakta olup 4Kve üstü çözünürlükler birçok önemli uygulamada kullanılır hale gelmiştir.

 

Hikvision, uzun yıllardır güvenlik sektöründe kendi araştırma ve geliştirmebecerileriyle faaliyet gösteren, muazzam miktarlarda eş zamanlı video vegörüntü verisini eğitme verileri olarak kullanan bir şirkettir. Muazzam ölçüdeyüksek kaliteli veri ve video görüntülerini etiketleyecek yüzün üzerinde ekipüyesi ile milyonlarca kategoride örnek veriler toplanmaktadır. Bu kadar büyükölçüde kaliteli eğitim verileri söz konusu olduğunda, insan, araç ve nesnetanıma modelleri de video izleminde çok daha doğru sonuçlar ortaya koyacaktır.

Ayrıca, yüksek performanslı donanım platformları, daha yüksek bir hesaplamagücü sağlamaktadır. Derin öğrenme modelinde çok fazla sayıda numuneye ihtiyaçolduğundan, çok sayıda da hesaplama yapılması kaçınılmazdır. Geçmişte donanımcihazları, yüzden fazla katmanlı derin öğrenme modellerini işleyemiyordu.2011’de Google DeepMind, yaklaşık 1 milyar sinir hücreli bir sinir ağınıharekete geçirmek adına 16.000 CPU’lu 1000 adet cihaz kullanmıştır. Bugün ise,benzer bir hesaplama gücünü, üstelik daha hızlı bir öz-yineleme ile elde etmekiçin birkaç adet GPU yeterli olabilmektedir. GPU’ların hızlı gelişimiylebirlikte süper bilgisayarlar, bulut hesaplama ve diğer yüksek performanslıdonanım platformları derin öğrenmeyi mümkün kılmıştır.

 

Son olarak, ağ yapısı da gelişmiş derin öğrenmede rol oynamaktadır. Derinöğrenme algoritmaları sürekli iyileştirilerek daha iyi hedef-nesne tanımayetisi elde edilebilir. Yüz tanıma gibi daha karmaşık durumlar veya farklıışık, açı, pozisyon, ifade, aksesuar, çözünürlük gibi unsurların söz konusuolduğu durumlarda ise ağ yapısı, tanıma işleminin doğruluğuna etki edecektir.Diğer bir deyişle, derin öğrenme algoritmalarında katman sayısı arttıkça,performans da artmaktadır.

 

2016 yılında Hikvision, ImageNet 2016 Büyük Ölçekli Görsel TanımaYarışmasında (ImageNet Large Scale Visual Recognition Challenge 2016), GörüntüSınıflandırma kategorisinde birinci olmuştur. Hikvision Araştırma Enstitüsüekibi, yapmış olduğu eğitim ve test deneyleri sonucunda çok daha az sürede dahaiyi bir performans gösterdiğini tespit ettiği inception-tipi ağları ve çok daderin olmayan rezidüel ağları kullanmıştır. Ayrıca, yine Hikvision’ın AraştırmaEnstitüsünün geliştirmiş olduğu Derin Öğrenmeye dayalı Optik Özellik Tanıma(OCR) Teknolojisi, ICDAR 2016 İyi Okuma Yarışmasında (ICDAR 2016 Robust ReadingCompetition) birincilik elde etmiştir. Hikvision ekibi, doğuştan-dijital,odaklı görüntü metni ve tesadüfi görüntü metni olmak üzere üç farklıkelime-tanıma etabında güçlü yerli ve yabancı rakiplerine büyük bir farkatarak, Hikvision tanıma teknolojisinin dünyada lider pozisyona oturduğunugöstermiştir.

 

Derin Öğrenme Ürünlerinin Uygulaması

 

Geçtiğimiz iki yılda derin öğrenme teknolojisi, konuşma tanıma, bilgisayargörüşü, ses çevirisi ve diğer pek çok konuda mükemmelliğe ulaşmıştır. Hatta yüzonaylama ve görüntü sınıflandırma konusunda insan becerilerin dahi ötesinegeçmiş olduğundan, güvenlik sektöründe video izlem konusunda son dereceönemlidir.

 

Hedef tespiti, takibi ve tanımada akıllı video uygulamasında derinöğrenmenin çok önemli bir yeri vardır. Derin öğrenme bu üç işlevi uygularken,güvenlik video izleme sektörünün her bir unsuruyla ilişkilidir: yüz tanıma,araç tespiti, motorsuz araç tespiti, yüz tanıma, araç marka tanıma, yayatespiti, insan vücudu özellik tespiti, olağan dışı yüz tespiti, kalabalıkdavranışı analizi, çoklu hedef takibi vb.

 

Bu tür akıllı işlevler, ön-uçlu gözlem kamerası serisi, arka-uçlusunuculara ve derin öğrenme algoritmalarını destekleyen diğer ürünlere ihtiyaçduymaktadır. Küçük ölçekli uygulamalarda ön-uçlu kameralar, yapılandırılmışinsan ve araç özelliği çıkartma işlevini doğrudan çalıştırabilir ve on binlerceinsan yüzü görüntüsü ön-uçlu cihazlarda depolanarak doğrudan yüzkarşılaştırması yapılabilir. Bu sayede, sunucu iletişimi maliyetleri düşürülür.Büyük-ölçekli uygulamalarda ise, ön-uçlu kameralar arka-uçlu sunucularlabirlikte çalışabilir. Yapılandırılmış video görevi, ön-uçlu cihazlarcayürütülerek, arka-uçlu cihazların iş yükü azaltılır. Bu durumda, arka-uçlusunucuların eşleştirme ve arama konusundaki etkinlikleri de iyileştirilmişolur.

 

Hikvision, derin öğrenme teknolojisi içeren ürünlerini yıl içinde piyasayasunmaya hazırlanmaktadır. Bu ürünlerden biri de, insan, araç ve nesneözellikleri ve davranışlarını doğru bir şekilde tespit edebilen, tanıyabilen veanaliz edebilen DeepInview Serisi kameralar olup, bu kameralar iç ve dışortamlarda yaygın bir şekilde kullanılabilecektir. Bir diğer önemli örnek,Hikvision DeepInmind Serisi NVR’lerdir. Bu ürünler, gelişmiş derin öğrenmealgoritmaları içermekte olup insan düşünceleri ve hafızasını taklit etmeyeteneğine sahiptir. DeepInmind ürünleri, geleneksel NVR ürünlerininavantajlarını ve yapılandırılmış video analiz işlevlerini içermenin yanı sıra,yenilikçi NVR+GPU moduna da sahiptir ve tüm bunlar bir araya geldiğindevideonun değeri son derece artar.

 

Derin öğrenme, yapay zekanın gelişiminde bir sonraki seviyedir. Özellik veunsurların denetimli sınıflandırmasının algoritmalarla yapılandırıldığı makineöğrenmesinin çok daha ötesidir. Derin öğrenme, denetimsiz veya “öz-öğrenme”ilkelerini kullanır. Hikvision bu kavramı, kendi analitik algoritmalarındageliştirmektedir. Çok-katmanlı öğrenme ve muazzam ölçüde veri toplama işlevlerisayesinde de gelişmiş doğruluk oranı elde edilmektedir. Bu algoritmanın yüztanıma, araç tanıma ve insan tanımada ve diğer platformlarda kullanılmasıylabirlikte, analizlerin performansı da ciddi oranda gelişecektir.