REGEX (Regular Expressions) Nedir? Veri Analizinde REGEX Nasıl Kullanılır?

Regex (Regular Expressions) Nedir? Veri Analizinde REGEX Nasıl Kullanılır?
Hosting Fiyatları

Regular expressions yani düzenli ifadeler (genellikle “REGEX” veya “REGEXP” olarak adlandırılır), metinle çalışmak için güçlü bir araçtır. Metni eşleştirmek veya değiştirmek için kullanılabilecek bir arama modeli tanımlayan bir dizi karakterdir. Düzenli ifadeler, aşağıdakiler gibi çok çeşitli görevler için kullanılabilir:

Kaynak: coderpad

1. Metinde kalıp arama

Bir metin dizisinde belirli karakter kalıplarını aramak için düzenli ifadeleri kullanabilirsiniz. Örneğin, bir belgedeki tüm e-posta adreslerini aramak için düzenli bir ifade kullanabilirsiniz.

2. Metni değiştirme

Belirli bir kalıpla eşleşen metni değiştirmek için düzenli ifadeleri kullanabilirsiniz. Örneğin, bir belgede “köpek” kelimesinin tüm geçtiği yerleri “kedi” ile değiştirmek için düzenli ifadeleri kullanabilirsiniz.

3. Girdiyi doğrulama

Bir e-posta adresinin veya telefon numarasının doğru biçimde olduğunun kontrol edilmesi gibi kullanıcı girdisini doğrulamak için düzenli ifadeler kullanılabilir.

4. Bilgi çıkarma

Bir metin dizisinden belirli bilgi parçalarını çıkarmak için düzenli ifadeleri kullanabilirsiniz. Örneğin, bir belgeden tüm tarihleri çıkarmak için düzenli ifadeleri kullanabilirsiniz.

Düzenli ifadeleri, Python, Java, JavaScript, Perl vb. birçok programlama dili tarafından desteklenir. Etkili bir şekilde kullanmayı öğrenmeniz gereken kendi söz dizimleri ve kuralları vardır. Bu söz dizimi ve kurallar çözmeye çalıştığınız soruna bağlı olarak basit veya karmaşık olabilir.

Düzenli ifadelerin söz dizimi, uygulamaya bağlı olarak değişebilir, ancak çoğu düzenli ifade, “.” gibi özel karakterlerin bir kombinasyonunu kullanır.

Düzenli İfadelerin Temelleri

Kaynak: myclickguide

Aşağıda en temel düzenli ifadelerin bir listesini bulabilirsiniz:

1. “.”, herhangi bir tek karakterle eşleşir.

2. “*”, önceki karakter veya gruptan sıfır veya daha fazlasıyla eşleşir.

3. “+”, önceki karakter veya gruplardan biri veya daha fazlasıyla eşleşir.

4. “?” sıfır veya önceki karakter veya gruptan biriyle eşleşir.

5. {n}, önceki karakter veya gruptaki n ile tam olarak eşleşir.

6. {n,}, önceki karakter veya gruptan n veya daha fazlasıyla eşleşir.

7. {n,m}, önceki karakter veya gruptan en az n ve en çok m ile eşleşir.

8. “^” satırın başlangıcıyla eşleşir.

9. “$” satırın sonuyla eşleşir.

10. “[]”, bir dizi karakterle eşleşir. Örneğin, [abc], “a”, “b” veya “c” karakterlerinden herhangi biriyle eşleşir.

11. “[^]”, kümede olmayan herhangi bir karakterle eşleşir. Örneğin, [^abc], “a”, “b” veya “c” olmayan herhangi bir karakterle eşleşir.

12. “|”i |’den önceki veya sonraki ifadeyle eşleşir. Örneğin, abc|def, “abc” veya “def” ile eşleşir.

13. “()” karakterleri birlikte gruplandırır. Örneğin, a(b|c)d, “abd” veya “acd” ile eşleşir.

14. “\”; ., *, + gibi özel karakterlerden kaçar.

Yukarıda listelediklerimiz temel düzenli ifadelerdir ve sözdizimi, kullandığınız dile veya araca göre değişebilir.

Regex Neden Önemlidir?

Regex, metni eşleştirmek ve değiştirmek için kullanılabilecek güçlü bir araçtır. Belirli metin kalıplarını aramak ve değiştirmek için genellikle programlama dillerinde ve metin düzenleme yazılımlarında kullanılır.

Düzenli ifadelerin bu kadar önemli olmasının ana nedenlerinden biri, metni çok esnek ve verimli bir şekilde aramanıza ve değiştirmenize izin vermesidir. Örnek vermek gerekirse, düzenli ifadeleri aşağıdaki amaçlar için kullanabilirsiniz:

  • Bir veri tabanındaki tüm e-posta adreslerini veya bir web sayfasındaki tüm URL’leri bulmak gibi büyük miktarda veride belirli metin kalıplarını arama.
  • Bir telefon numarasının veya e-posta adresinin doğru biçimde olduğundan emin olmak gibi kullanıcı girişlerini doğrulama.
  • Metni, tüm istenmeyen karakterleri kaldırmak veya bir metin parçasından biçimlendirmek gibi farklı bir metinle değiştirme.
  • Bir metin dosyasından tüm tarihleri çıkarmak gibi metinden belirli bilgileri ayıklama.

Düzenli ifadeler ayrıca birçok programlama dili, metin düzenleyici ve komut satırı aracı tarafından geniş çapta desteklenir ve bu da onları metinle çalışmak için çok yönlü ve taşınabilir bir araç haline getirir.

Özetle, düzenli ifadeler metinle çalışmak için güçlü araçlardır ve metni esnek ve verimli bir şekilde aramanıza, eşleştirmenize, ayıklamanıza ve değiştirmenize olanak tanır. Birçok programlama dili, metin editörü ve komut satırı aracı tarafından geniş çapta desteklenir, bu da onları çok yönlü ve taşınabilir bir araç haline getirir.

Regex Nasıl Yazılır?

Söz dizimi karmaşık olabileceğinden ve aralarından seçim yapabileceğiniz birçok farklı seçenek olduğundan, regex yazmak biraz zor olabilir. Ancak, düzenli ifadeler yazmanıza yardımcı olacak bazı genel ipuçları aşağıdaki şekildedir:

1. Temel ifadelerle başlayın

Karmaşık bir düzenli ifade yazmaya başlamadan önce ., *, +, ? ve [] karakterleri gibi temel ifadelerle alıştırma yapın.

2. Düzenli ifadenizi test edin

Beklediğiniz kalıplarla eşleştiğinden ve istemediğiniz kalıplarla eşleşmediğinden emin olmak için düzenli ifadenizi her zaman örnek veriler üzerinde test edin.

3. Bir araç kullanın

Düzenli ifadeleri yazmanıza ve test etmenize yardımcı olabilecek, çevrimiçi düzenli ifade test araçları veya yerleşik düzenli ifade desteğine sahip metin düzenleyici gibi birçok araç vardır.

4. Problemi parçalara ayırın

Çözmeye çalıştığınız problemi daha küçük parçalara ayırın ve her parça için düzenli ifadeler yazın. Ardından, son düzenli ifadeyi yapmak için parçaları birleştirin.

5. Spesifik olun

Düzenli ifadenizi yazarken mümkün olduğunca spesifik olun. Örneğin, herhangi bir karakterle eşleştirmek için . karakteri kullanmak yerine yalnızca belirli karakterlerle eşleştirmek için bir karakter sınıfı [] kullanın.

6. Düzenli ifadenizi belgeleyin

Düzenli ifadenizi, ne işe yaradığını ve nasıl çalıştığını açıklamak için yorumlar veya notlarla belgeleyin. Bu, gelecekte sizin veya başkalarının bunu anlamasına yardımcı olacaktır.

7. Basit tutun

Karmaşık düzenli ifadelerin anlaşılması ve sürdürülmesi zor olabileceğinden, düzenli ifadenizi olabildiğince basit tutmaya çalışın.

8. Kaçış karakterlerini kullanın

Özel bir karakteri eşleştirmek istediğinizde, düzenli ifade motorunun onu özel bir karakter olarak yorumlamaması için bir ters eğik çizgi ” ile ondan kaçmanız gerekir.

Kullanabileceğiniz bazı düzenli ifade örnekleri aşağıdakileri içerir:

  • \d herhangi bir rakamla eşleşir.
  • \w herhangi bir kelime karakteriyle eşleşir (alfanümerik karakterler ve alt çizgi).
  • \s herhangi bir boşluk karakteriyle (boşluk, sekme, yeni satır vb.) eşleşir.
  • [a-z] herhangi bir küçük harfle eşleşir.
  • [A-Z] herhangi bir büyük harfle eşleşir.
  • [0-9] herhangi bir rakamla eşleşir.

Daha karmaşık düzenli ifadeler oluşturmak için bu temel yapı taşlarını kullanabileceğinizi unutmayın. Düzenli ifadelerinizi daha iyi anlamak ve bunları kullanma konusundaki güveninizi artırmak için denemeye ve test etmeye devam edin.

Popüler 10 REGEX

Aşağıda yaygın olarak kullanılan 10 popüler REGEX örneğini bulabilirsiniz:

  • Bir kelimeyi eşleştirme: \b\w+\b
  • Bir e-posta adresi eşleştirme: \b\w+@[a-z]+.[a-z]{2,3}\b
  • Bir telefon numarasını eşleştirme: \b\d{3}-\d{3}-\d{4}\b
  • Bir IP adresiyle eşleştirme: \b\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}\b
  • Bir tarih eşleştirme (aa/gg/yyyy): \b\d{2}/\d{2}/\d{4}\b
  • Bir zaman eşleştirme (ss:dd:ss): \b\d{2}:\d{2}:\d{2}\b
  • Bir URL eşleştirime: (http|https)://[\w-]+(.[\w-]+)+([\w.,@?^=%&:/~+#-]*[ \w@?^=%&/~+#-])?
  • Sosyal güvenlik numarası eşleştirme: \b\d{3}-\d{2}-\d{4}\b
  • Onaltılık renk koduyla eşleştirme: #[a-fA-F0-9]{6}
  • Bir HTML etiketiyle eşleştirme: <[^>]+>

Veri Analizinde REGEX Nasıl Kullanılır?

Kaynak: audiword

Veri analizinde regex kullanmanın bazı yolları aşağıdakileri içerir:

1. Veri temizleme

Fazladan boşlukları veya alfasayısal olmayan karakterleri kaldırmak gibi istenmeyen karakterleri veya biçimlendirmeyi kaldırarak verileri temizlemek için düzenli ifadeleri kullanabilirsiniz.

2. Veri çıkarma

Büyük bir metin veri kümesinden tüm e-posta adreslerini veya telefon numaralarını ayıklamak gibi, bir veri kümesinden belirli bilgileri ayıklamak için düzenli ifadeleri kullanabilirsiniz.

3. Veri doğrulama

Bir veri kümesindeki tüm e-posta adreslerinin veya telefon numaralarının doğru biçimde olduğundan emin olmak gibi verileri doğrulamak için düzenli ifadeler kullanabilirsiniz.

4. Veri gruplandırma

Tüm e-posta adreslerini alan adına göre gruplamak gibi, verileri belirli kategorilerde gruplandırmak için düzenli ifadeleri kullanabilirsiniz.

5. Veri dönüştürme

Tüm tarihleri belirli bir biçime dönüştürmek veya belirli bir sözcüğün tüm oluşumlarını başka bir sözcükle değiştirmek gibi verileri dönüştürmek için düzenli ifadeleri kullanabilirsiniz.

6. Veri görselleştirme

Belirli bir düzenli ifadeyle eşleşen bir veri kümesindeki tüm sözcüklerden oluşan bir sözcük bulutu oluşturmak gibi, bir veri kümesindeki belirli kalıpların görselleştirmelerini oluşturmak için düzenli ifadeleri kullanabilirsiniz.

Bunlar, veri analizinde düzenli ifadeleri kullanmanın bazı yollarıdır, ancak olasılıklar, çözmeye çalıştığınız soruna ve üzerinde çalıştığınız verilere bağlı olarak sonsuzdur.

Google Analytics REGEX Örnekleri

Aşağıdaki listede en popüler 5 Google Analytics REGEX örneklerini bulabilirsiniz:

  • Kampanya Kaynağı/Aracı Eşleşmesi: ^(google|bing|facebook|linkedin|twitter)
  • Dahili Trafiği Hariç Tut: ^((?!(yourdomain|localhost)).)*$
  • Dinamik Yeniden Pazarlama AdWords Etiketi: ^AW-(\d{6})-(\d{6})
  • Alan ve Alt Alan Eşleştirme: ^(https?:\/\/)([^\/]+)(.*)$
  • Sorgu Parametrelerini Kaldır: ^([^\?]+)(\?.*)?$

İlgili İçerikler:

Google Analytics 4 Nedir? Google Universal Analytics – GA4 Geçişi

Google Analytics Nedir, Nasıl Kurulur?


Google Search Console REGEX Örnekleri

Aşağıdaki listede en popüler 5 Google Search Console REGEX örneklerini bulabilirsiniz:

  • Eşleşme Özel Sorgusu: ^.\b(keyword1|keyword2)\b.$
  • URL Parametrelerini Hariç Tut: ^(https?:\/\/)([^\/]+)([^\?]+)(\?.)?$
  • Match Alt Dizinleri: ^(https?:\/\/)([^\/]+)(\/.\/.\/)$
  • Yalnızca Alanı Eşleştir: ^(https?:\/\/)([^\/]+)(\/.)?$
  • Dosya Uzantılarını Eşleştir: ^(https?:\/\/)([^\/]+\/.\/.).(html|php|aspx)$
  • Uzun Kuyruklu Aramaları Eşleştir: ([^” “]*\s){4,}

PERL Programlama Dilinde REGEX Örnekleri

Aşağıdaki listede PERL programlama dilinde en popüler 10 REGEX örneğini bulabilirsiniz:

  • Belirli Bir Kelimeyi Eşleştir: /\bword\b/
  • E-posta Adresini Çıkar: /\b\w+@[a-z]+.[a-z]{2,3}\b/
  • Bir Telefon Numarası Eşleştir: /\b\d{3}-\d{3}-\d{4}\b/
  • HTML Etiketlerini Kaldır: s/<[^>]+>//g
  • IP Adresini Çıkar: /\b\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}\b/
  • Birden Fazla Boşluğu Tek Boşlukla Değiştir: s/ +/ /g
  • Bir Tarih Eşleştir: /\b\d{2}\/\d{2}\/\d{4}\b/
  • Bir Zaman Eşleştir: /\b\d{2}:\d{2}:\d{2}\b/
  • URL’yi Çıkar: /\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~|!:,.;]*[-A-Z0 -9+&@#\/%=~|]/
  • Bir Sosyal Güvenlik Numarasıyla Eşleştir: /\b\d{3}-\d{2}-\d{4}\b/

Google Spreadsheet REGEX Örnekleri

Google Spreadsheets üzerinde REGEX komutlarını kullanabilmek için üç farklı formül bulunmaktadır;

  1. REGEXMATCH()
  2. REGEXEXTRATCH()
  3. REGEXREPLACE()

Aşağıdaki listede en popüler 10 Google Spreadsheet örneğini bulabilirsiniz:

  • İlk Adı Çıkar: =REGEXEXTRACT(A2, "^[A-Z][a-z]+")
  • Soyadı Çıkar: =REGEXEXTRACT(A2, "[A-Z][a-z]+$")
  • Telefon Numarasını Çıkar: =REGEXEXTRACT(A2, "\d{3}-\d{3}-\d{4}")
  • E-posta Adresini Çıkar: =REGEXEXTRACT(A2, "[a-z0-9._%+-]+@[a-z0-9.-]+.[a-z]{2,}")
  • IP Adresini Ayıkla: =REGEXEXTRACT(A2, "\b\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}\b")
  • URL’yi Çıkar: =REGEXEXTRACT(A2, "(http|https)://[\w-]+(.[\w-]+)+([\w.,@?^=%&:/~+) #-]*[\w@?^=%&/~+#-])?")
  • Alanı Adını Çıkarın: =REGEXEXTRACT(A2, "https?://([^/]+)/")
  • Çıkarma Tarihi: =REGEXEXTRACT(A2, "\b\d{2}/\d{2}/\d{4}\b")
  • Çıkarma Süresi: =REGEXEXTRACT(A2, "\b\d{2}:\d{2}:\d{2}\b")
  • Sosyal Güvenlik Numarasını Çıkarın: =REGEXEXTRACT(A2, "\b\d{3}-\d{2}-\d{4}\b")

Python Programlama Dilinde REGEX Örnekleri

Aşağıdaki listede Python programlama dilinde en popüler 10 REGEX örneğini bulabilirsiniz:

  • Belirli Bir Kelimeyi Eşleştirme: re.search(r"\bword\b", text)
  • E-posta Adresini Çıkarma: re.search(r"\b\w+@[a-z]+.[a-z]{2,3}\b", text)
  • Bir Telefon Numarasını Eşleştirme: re.search(r"\b\d{3}-\d{3}-\d{4}\b", text)
  • HTML Etiketlerini Kaldırma: re.sub(r"<[^>]+>", "", text)
  • IP Adresini Çıkarma: re.search(r"\b\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}\b", text)
  • Birden Fazla Boşluğu Tek Boşlukla Değiştirme: re.sub(r" +", " ", text)
  • Bir Tarihi Eşleştirme: re.search(r"\b\d{2}/\d{2}/\d{4}\b", text)
  • Bir Zamanı Eşleştirme: re.search(r"\b\d{2}:\d{2}:\d{2}\b", text)
  • URL’yi Çıkarma: re.search(r"(http|https)://[\w-]+(.[\w-]+)+([\w.,@?^=%&:/~+#-]*[\w@?^=%&/~+#-])?", text)
  • Bir Sosyal Güvenlik Numarasıyla Eşleştirme: re.search(r"\b\d{3}-\d{2}-\d{4}\b", text)

İlgili İçerik: Python Nedir?


Regex’i Neden Öğrenmelisiniz?

Normal ifadeler (REGEX), metin verilerindeki kalıpları eşleştirmek için güçlü araçlardır ve çeşitli uygulama ve programlama dillerinde yaygın olarak kullanılır. REGEX’i öğrenmeniz için birkaç neden vardır. Bu nedenler aşağıdaki gibidir:

1. Metin İşleme

REGEX, arama, eşleştirme ve değiştirme gibi karmaşık metin işleme görevlerini gerçekleştirmek için kullanılabilir. Özellikle büyük miktarlarda yapılandırılmamış metin verileriyle uğraşırken yararlıdır.

2. Doğrulama

REGEX bir e-posta adresinin doğru biçimlendirilip biçimlendirilmediğini veya bir telefon numarasının geçerli olup olmadığını kontrol etmek gibi formlardaki kullanıcı girişini doğrulamak için kullanılabilir.

3. Otomasyon

REGEX, yinelenen metin işleme görevlerini otomatikleştirmeye ve zamandan ve emekten tasarruf etmeye yardımcı olabilir. Bu nedenle komut dosyası oluşturma ve otomasyon araçlarında yaygın olarak kullanılırlar.

4. Geliştirilmiş Üretkenlik

Normal ifadeleri kullanarak, karmaşık metin işleme görevlerini birkaç satır kodla gerçekleştirebilirsiniz. Bu da genel üretkenliğinizi ve verimliliğinizi artırabilir.

5. Platformlar Arası Destek

Normal ifadeler birçok programlama dili ve platformunda desteklenir, bu da onu çalıştığınız ortam ne olursa olsun değerli bir araç haline getirir.

Sonuç olarak, normal ifadeleri öğrenmek, metin verilerini işleme yeteneğinizi büyük ölçüde geliştirebilir ve günümüzün teknoloji odaklı dünyasında sahip olunması gereken değerli bir beceridir.

REGEX Kodu/Komutu Yazıp Test Edebileceğiniz En İyi 5 Web Sitesi

  1. Regexlearn.com
  2. Regexr.com
  3. Regex101.com
  4. Regextester.com
  5. Debuggex.com/

İlgili İçerikler:

Veri Görselleştirme (Data Visualization) Nedir, Nasıl Yapılır? En İyi 5 Veri Görselleştirme Aracı/Programı/Uygulaması

Veri Analizi Nedir, Büyük Veri Analizi Nasıl Yapılır?

Big Data (Büyük Veri) Nedir, Nasıl Analiz Edilir?

REGEX (Regular Expressions) Nedir? Veri Analizinde REGEX Nasıl Kullanılır?

Yazılım Dilleri, Geleceğin Yazılım Dilleri

Code Interpreter Nedir? Yazılımcıların İşi Tehlikede mi?

10 Adımda Dijital Pazarlama Nasıl Yapılır?

SQL (Structured Query Language) Nedir? Kullanım Alanları ve Örnekleri

PostgreSQL Nedir? Özellikleri, Avantajları ve SQL’den Farkları

Regresyon Nedir? Yeni Başlayanlar İçin Ayrıntılı Regresyon Analizi

SWOT Analizi Nedir? Başarılı Stratejiler Kurmak İçin SWOT Analizi Yapın

PaaS (Platform as a Service) Nedir? PaaS vs. IaaS Arasındaki Farklar

Iaas (Infrastructure as a Service) Nedir? Iaas vs. Paas Arasındaki Farklar

Korelasyon Nedir? Nedensellik vs. Korelasyon Arasındaki Farklar

Domain Sorgulama