Veri
Bilgi arayışında veri (ABD: /ˈdætə/; Birleşik Krallık: /ˈdeɪtə/), en temel biçimlerinde nicelik, nitelik, gerçek, istatistik veya diğer temel anlam birimlerini ifade eden kavramsal bir modeldeki ayrı bilgi birimleri topluluğudur. Büyük ölçüde arkaik olan veri, bir veri kümesindeki bir öğedir. Veriler genellikle ek bağlam ve anlam sağlayan ve kendileri de daha büyük yapılarda veri olarak kullanılabilen tablolar gibi yapılar halinde düzenlenir. Veriler bir hesaplama sürecinde değişkenler olarak kullanılabilir. Veriler soyut fikirleri veya somut ölçümleri temsil edebilir. Veriler bilimsel araştırmalarda, finansta ve neredeyse diğer her türlü insani organizasyonel faaliyette yaygın olarak kullanılmaktadır. Veri kümesi örnekleri şunları içerir hisse senedi fiyatları, suç oranları, işsizlik oranları, okuryazarlık oranları ve nüfus sayımı verileri. ⓘ
Veriler ölçüm, gözlem, sorgulama veya analiz gibi teknikler kullanılarak toplanır ve tipik olarak daha fazla işlenebilecek sayılar veya karakterler olarak temsil edilir. Saha verileri, kontrolsüz ve yerinde bir ortamda toplanan verilerdir. Deneysel veriler, kontrollü bir bilimsel deney sırasında üretilen verilerdir. Veriler hesaplama, muhakeme, tartışma, sunum, görselleştirme veya diğer post-analiz biçimleri gibi teknikler kullanılarak analiz edilir. Analizden önce ham veriler (veya işlenmemiş veriler) tipik olarak temizlenir: Aykırı değerler kaldırılır ve bariz araç veya veri giriş hataları düzeltilir. ⓘ
Veri, "dijital ekonominin yeni petrolü" olarak tanımlanmaktadır. Genel bir kavram olarak veri, mevcut bazı bilgi veya enformasyonun daha iyi kullanım veya işleme için uygun bir biçimde temsil edilmesi veya kodlanması anlamına gelir. Veri, hesaplama, muhakeme veya tartışma için bir temel olarak kullanılabilecek en küçük olgusal bilgi birimleridir. Veriler, soyut fikirlerden somut ölçümlere, istatistikler dahil ancak bunlarla sınırlı olmamak üzere çeşitlilik gösterebilir. İlgili bir bağlamda sunulan tematik olarak bağlantılı veriler bilgi olarak görülebilir. Bağlamsal olarak bağlantılı bilgi parçaları daha sonra veri içgörüleri veya istihbarat olarak tanımlanabilir. Verilerin enformasyona sentezlenmesi sonucunda zaman içinde biriken içgörü ve istihbarat stoku ise bilgi olarak tanımlanabilir. ⓘ
Bilgi işlem teknolojilerindeki gelişmeler Büyük Verinin ortaya çıkmasına yol açmıştır. Büyük Veri genellikle petabayt ölçeğinde çok büyük miktarlarda veriyi ifade eder. Geleneksel veri analizi yöntemleri ve bilgi işlem kullanarak, bu kadar büyük (ve büyüyen) veri kümeleriyle çalışmak zor, hatta imkansızdır. (Teorik olarak konuşmak gerekirse, sonsuz veri sonsuz bilgi üretecek ve bu da içgörü veya zeka elde etmeyi imkansız hale getirecektir). Buna karşılık, nispeten yeni bir alan olan Veri Bilimi, analitik yöntemlerin Büyük Verilere verimli bir şekilde uygulanmasına olanak tanıyan makine öğrenimi (ve diğer Yapay Zeka (AI)) yöntemlerini kullanır. ⓘ
Etimoloji ve terminoloji
"Veri" kelimesinin ilk İngilizce kullanımı 1640'lara dayanmaktadır. "Veri" kelimesi ilk kez 1946 yılında "aktarılabilir ve depolanabilir bilgisayar bilgisi" anlamında kullanılmıştır. "Veri işleme" ifadesi ise ilk kez 1954 yılında kullanılmıştır. ⓘ
Latince data kelimesi datum, "(verilen şey)" kelimesinin çoğuludur, dare "vermek" fiilinin nötr geçmiş zaman ortacıdır. İngilizcede data kelimesi bu anlamda çoğul bir isim olarak kullanılabilir, bazı yazarlar - genellikle doğa bilimleri, yaşam bilimleri ve sosyal bilimlerde çalışanlar - özellikle 20. yüzyılda ve çoğu durumda 21. yüzyılda datum kelimesini tekil, data kelimesini çoğul olarak kullanmaktadır (örneğin, 7. baskıdan itibaren APA stili hala "data" kelimesinin çoğul olmasını gerektirmektedir). Bununla birlikte, günlük dilde ve yazılım geliştirme ve bilgisayar bilimi kullanımının çoğunda, "veri" çoğunlukla bir kitle ismi olarak tekil kullanılır ("kum" veya "yağmur" gibi). Büyük veri terimi tekil olarak kullanılır. ⓘ
Anlamı
thumb|right|page=60|Adrien Auzout'un 1665 tarihli Philosophical Transactions makalesinden "A TABLE of the Apertures of Object-Glasses" Veri, enformasyon, bilgi ve bilgelik birbiriyle yakından ilişkili kavramlardır, ancak her birinin diğeriyle ilgili bir rolü ve her terimin bir anlamı vardır. Yaygın bir görüşe göre, veri toplanır ve analiz edilir; veri ancak bir şekilde analiz edildikten sonra karar vermeye uygun bilgi haline gelir. Bir veri kümesinin bir kişi için ne ölçüde bilgilendirici olduğunun, o kişi tarafından ne ölçüde beklenmedik olduğuna bağlı olduğu söylenebilir. Bir veri akışının içerdiği bilgi miktarı, Shannon entropisi ile karakterize edilebilir. ⓘ
Bilgi, bir konudaki enformasyonla ilgili kapsamlı deneyime dayanan anlayıştır. Örneğin, Everest Dağı'nın yüksekliği genellikle veri olarak kabul edilir. Yükseklik bir altimetre ile hassas bir şekilde ölçülebilir ve bir veri tabanına girilebilir. Bu veriler, Everest Dağı ile ilgili diğer verilerle birlikte bir kitapta yer alarak, dağı, tırmanmak için en iyi yönteme karar vermek isteyenlere faydalı olacak şekilde tanımlayabilir. Dağlara tırmanma deneyimine dayanan ve kişilere Everest Dağı'nın zirvesine ulaşma yolunda tavsiyelerde bulunabilecek bir anlayış "bilgi" olarak görülebilir. Bu bilgiye dayanarak Everest Dağı'nın zirvesine pratik olarak tırmanmak ise "bilgelik" olarak görülebilir. Başka bir deyişle, bilgelik, bir kişinin bilgisini iyi sonuçlanabilecek durumlarda pratik olarak uygulamasını ifade eder. Böylece bilgelik, giderek soyutlaşan kavramlardan oluşan "veri", "enformasyon" ve "bilgi" serilerini tamamlar ve bütünler. ⓘ
Verinin genellikle en az soyut kavram, enformasyonun bir sonraki en az soyut kavram ve bilginin de en soyut kavram olduğu varsayılır. Bu görüşe göre, veri yorumlanarak bilgiye dönüşür; örneğin, Everest Dağı'nın yüksekliği genellikle "veri" olarak kabul edilir, Everest Dağı'nın jeolojik özellikleri üzerine bir kitap "bilgi" olarak kabul edilebilir ve Everest Dağı'nın zirvesine ulaşmanın en iyi yolu hakkında pratik bilgiler içeren bir dağcı rehberi "bilgi" olarak kabul edilebilir. "Bilgi", günlük kullanımdan teknik kullanıma kadar uzanan bir anlam çeşitliliği taşır. Ancak bu görüşün, verinin enformasyondan, enformasyonun da bilgiden nasıl ortaya çıktığını tersine çevirdiği de ileri sürülmüştür. Genel olarak bilgi kavramı, kısıtlama, iletişim, kontrol, veri, biçim, talimat, bilgi, anlam, zihinsel uyaran, örüntü, algı ve temsil kavramlarıyla yakından ilişkilidir. Beynon-Davies, veri ve enformasyonu birbirinden ayırmak için işaret kavramını kullanır; veri bir dizi semboldür, enformasyon ise semboller bir şeye atıfta bulunmak için kullanıldığında ortaya çıkar. ⓘ
Bilgi işlem cihazlarının ve makinelerinin geliştirilmesinden önce, insanlar verileri elle toplamak ve üzerine kalıplar yerleştirmek zorundaydı. Bilgi işlem cihazlarının ve makinelerinin geliştirilmesinden bu yana, bu cihazlar da veri toplayabilmektedir. 2010'lu yıllarda bilgisayarlar, pazarlamadan vatandaşların sosyal hizmet kullanımlarının analizine ve bilimsel araştırmalara kadar pek çok alanda veri toplamak ve bunları sıralamak ya da işlemek için yaygın olarak kullanılmaktadır. Verilerdeki bu örüntüler, bilgiyi geliştirmek için kullanılabilecek bilgiler olarak görülmektedir. Bu kalıplar "gerçek" olarak yorumlanabilir ("gerçek" öznel bir kavram olabilir) ve bazı disiplinlerde veya kültürlerde estetik ve etik kriterler olarak yetkilendirilebilir. Geride algılanabilir fiziksel veya sanal kalıntılar bırakan olaylar, veriler aracılığıyla geriye doğru izlenebilir. İşaret ve gözlem arasındaki bağ koptuğunda işaretler artık veri olarak kabul edilmez. ⓘ
Mekanik bilgi işlem cihazları verileri nasıl temsil ettiklerine göre sınıflandırılır. Analog bir bilgisayar bir veriyi voltaj, mesafe, konum veya diğer fiziksel miktar olarak temsil eder. Dijital bir bilgisayar, bir veri parçasını sabit bir alfabeden alınan bir dizi sembol olarak temsil eder. En yaygın dijital bilgisayarlar ikili bir alfabe, yani tipik olarak "0" ve "1" olarak gösterilen iki karakterden oluşan bir alfabe kullanır. Sayılar veya harfler gibi daha bilinen gösterimler daha sonra ikili alfabeden oluşturulur. Bazı özel veri biçimleri ayırt edilir. Bir bilgisayar programı, talimatlar olarak yorumlanabilen bir veri topluluğudur. Çoğu bilgisayar dili programlar ve programların üzerinde çalıştığı diğer veriler arasında bir ayrım yapar, ancak bazı dillerde, özellikle Lisp ve benzeri dillerde, programlar esasen diğer verilerden ayırt edilemez. Meta verileri, yani diğer verilerin tanımını ayırt etmek de yararlıdır. Üst veri için benzer ancak daha eski bir terim "yardımcı veri "dir. Üst verinin prototipik örneği, kitapların içeriğinin bir açıklaması olan kütüphane kataloğudur. ⓘ
Veri belgeleri
Üzerine bir serinin parçası ⓘ |
Kütüphane ve bilgi bilimi |
---|
|
|
Verilerin kaydedilmesi gerektiğinde, veriler bir veri belgesi biçiminde bulunur. Veri belgelerinin türleri şunları içerir:
- veri havuzu
- veri̇ çalişmasi
- veri seti
- yazılım
- veri kağıdı
- veritabanı
- veri̇ el ki̇tabi
- veri̇ günlüğü ⓘ
Bu veri belgelerinden bazıları (veri havuzları, veri çalışmaları, veri setleri ve yazılımlar) Veri Atıf İndekslerinde indekslenirken, veri makaleleri Science Citation Index gibi geleneksel bibliyografik veri tabanlarında indekslenmektedir. Daha fazla bilgi için bkz. ⓘ
Veri toplama
Veri toplama, birincil kaynak (araştırmacı verileri elde eden ilk kişidir) veya ikincil kaynak (araştırmacı, bilimsel bir dergide yayınlanan veriler gibi başka kaynaklar tarafından zaten toplanmış olan verileri elde eder) yoluyla gerçekleştirilebilir. Veri analizi metodolojileri çeşitlilik gösterir ve veri üçgenleme ve veri süzme yöntemlerini içerir. İkincisi, verileri en üst düzeye çıkarmak için beş olası analiz açısını (en az üç) kullanarak verilerin toplanması, sınıflandırılması ve analiz edilmesine yönelik açık bir yöntem sunar Araştırmanın nesnelliğini ve incelenen olguların mümkün olduğunca eksiksiz bir şekilde anlaşılmasını sağlar: nitel ve nicel yöntemler, literatür taramaları (bilimsel makaleler dahil), uzmanlarla görüşmeler ve bilgisayar simülasyonu. Veriler daha sonra, önceden belirlenmiş bir dizi adım kullanılarak "süzülür" ve böylece en alakalı bilgiler. ⓘ
Diğer alanlarda
Verilerin diğer alanlarda da giderek daha fazla kullanılmasına rağmen, bunların son derece yorumlayıcı doğasının, "verili" olarak veri ethosuyla çelişebileceği öne sürülmüştür. Peter Checkland, çok sayıda olası veri ile bunların dikkatin yöneldiği bir alt kümesi arasında ayrım yapmak için capta (Latince capere, "almak") terimini ortaya atmıştır. Johanna Drucker, beşeri bilimler bilgi üretimini "konumlandırılmış, kısmi ve kurucu" olarak onayladığından, verileri kullanmanın, olguların ayrık olduğu veya gözlemciden bağımsız olduğu gibi verimsiz varsayımlar getirebileceğini savunmuştur. Gözlem eyleminin kurucu olduğunu vurgulayan capta terimi, beşeri bilimlerdeki görsel temsiller için veriye alternatif olarak önerilmektedir. ⓘ
İstatistikte veri kavramı
İstatistikte yorumlanmak ve sunulmak amacı ile toplanmış, çözümlenmiş ve özetlenmiş gerçeklere veriler denmektedir. Sayısal (nümerik) veriler nicel, nitel veriler ise kategorik olarak tanımlanmaktadır. Nicel veriler ayrıca kendi aralarında ayrışık ve sürekli olarak iki gruba ayrılmaktadır. Ayrışık veriler sayım yolu ile toplanmakta ve çoğu kez sayma sayıları cinsinden ifade edilmektedir. Sürekli veriler ise ölçüm yolu ile toplanmakta ve gerçek (reel) sayılar cinsinden ifade edilmektedir. Nitel veriler de nominal ve ordinal olarak iki gruba ayrılmaktadır. Nominal veriler yazı ile ifade edilmekte ve anlamlı herhangi bir sıralamaya tabi olmamaktadır. Ordinal veriler ise yazı ile ifade edilmekle birlikte anlamlı bir sırlamaya konabilen verilerdir. İstatistikte, doğum Yılı örneğinde olduğu gibi, doğrudan elde edilen veriler basit veriler; yaş = içinde Bulunulan Yıl − doğum Yılı örneğinde görüldüğü üzere, basit verilerin işlenmesi yolu ile elde edilen veriler de türetilmiş veriler olarak bilinmektedir. Sayılar cinsinden ifade edilmektedir . ⓘ
Telekomünikasyonda veri kavramı
Telekomünikasyon uygulamaları için veri, anlam ve bağlamdan bağımsız, bütünlüğü ve yapısı bozulmamış ve ekonomik olarak bir noktadan diğerine iletilmesi istenen metinler, sesler, görseller ve videoları ifade eder. ⓘ
İşletme yönetimi açısından veri kavramı
İşletme yönetiminde veriler fiziksel ve parasal hareketlerin kaydedilmesi, izlenmesi ve yönetim kararlarının verilmesi için kullanılmaktadır. Denetim ve karar verme süreçlerinin etkinliği bakımından, işletmecilikte veri kalitesi önemli bir yer tutmaktadır. Veri kalitesi, en genel anlamda, kaydedilen verilerin güvenilir ve kullanılabilir olması demektir. Kaliteli veriler ait oldukları kişi, nesne ve olguları geçerli bir biçimde betimlemektedir. Bu bakımdan veri kalitesi, verilerin temel oluşturduğu kararlarla ve karar vericilerle ilişkili bulunmaktadır. Verilerin geçerlilik derecesi bir ölçüde kullanım amacına bağlı olduğundan, veri kalitesi değerlendirmeleri için kullanılan ölçütler nesnel olabildiği gibi öznel de olabilmektedir. Yüksek veri kalitesi, başta kurumsal zeka uygulamaları olmak üzere, kurumsal kaynak planlaması, müşteri ilişkileri yönetimi, performans yönetimi, tedarik zinciri yönetimi ve elektronik ticaret çözümlerinin de başarısına olumlu katkıda bulunmaktadır. Buna karşın, özellikle satış, lojistik ve muhasebe operasyonlarında düşük veri kalitesinin yol açtığı aksaklıklar tepe yönetimlerinin dikkatinden kaçtığında ise, işletmeler açısından ciddi para ve itibar kayıpları söz konusu olabilmektedir. ⓘ