Show simple item record

 
dc.contributor.author Öztürk, Seçil
dc.contributor.author Sankur, Bülent
dc.contributor.author Güngör, Tunga
dc.contributor.author Yılmaz, Mustafa Berkay
dc.contributor.author Köroglu, Bilge
dc.contributor.author Ağın, Onur
dc.contributor.author İşbilen, Mustafa
dc.contributor.author Ulaş, Çağdaş
dc.contributor.author Ahat, Mehmet
dc.date.accessioned 2022-05-27T05:54:39Z
dc.date.available 2022-05-27T05:54:39Z
dc.date.issued 2014-04-01
dc.identifier.uri https://hdl.handle.net/20.500.12913/15
dc.description The dataset is a labeled text corpus in 35 academic disciplines compiled from journals and conference proceedings. For each discipline, 200 papers were compiled. Each text includes the topic, name of the resource, title of the paper, abstract, and keywords (if available). The corpus consists of 34 xml files where each file corresponds to a discipline. Each xml file contains information about 200 papers. Information for a paper has the following format: <makale> <Etiket>discipline</Etiket> <Başlık>paper title</Başlık> <Özetçe>paper abstract</Özetçe> <Anahtar>keywords separated by commas</Anahtar> <Kaynak>journal/conference name</Kaynak> <TürkçeKarakter>Sorunsuz/Sorunlu</TürkçeKarakter> </makale> Example: <makale> <Etiket>Arkeoloji</Etiket> <Başlık>Burdur Bölgesi Neolitik Çağ Mimarlığı ve Anadolu'daki Çağdaşları Arasındaki Konumu Hakkında</Başlık> <Özetçe> Bu makalede yeni kazılarda elde edilen bilgiler ışığında Burdur yöresinde yaklaşık 2000 yıl (İÖ 7000 - 5300) süren Neolitik Çağ boyunca mimaride gözlenen özellikleri irdeleyeceğiz. ... </Özetçe> <Anahtar></Anahtar> <Kaynak>Adalya - Akdeniz Medeniyetleri Araştırma Enstitüsü Yıllığı</Kaynak> <TürkçeKarakter>Sorunsuz</TürkçeKarakter> </makale>
dc.language.iso Turkish
dc.publisher Boğaziçi University
dc.relation.isreferencedby https://ieeexplore.ieee.org/abstract/document/6830499
dc.rights Apache License 2.0
dc.rights.uri http://opensource.org/licenses/Apache-2.0
dc.rights.label PUB
dc.subject Scientific papers
dc.subject Abstract
dc.subject Text classification
dc.title Scientific Abstracts Corpus
dc.type corpus
metashare.ResourceInfo#ContentInfo.mediaType text
hidden false
hasMetadata false
has.files yes
branding Community
contact.person Tunga Güngör gungort@boun.edu.tr Boğaziçi University
sponsor TÜBİTAK 3120918 TEYDEB nationalFunds
files.size 3423083
files.count 1


 Files in this item

This item is
Publicly Available
and licensed under:
Apache License 2.0
Icon
Name
Turkce_Makale_Derlemi.zip
Size
3.26 MB
Format
application/zip
Description
Unknown
MD5
58eeceb4777e95832fa8c68aecc4286b
 Download file  Preview
 File Preview  
  • Turkce Makale Derlemi
    • Temel Tip.xml375 kB
    • Cevre Muhendisligi.xml329 kB
    • Dahili Tip.xml298 kB
    • Harici Tip.xml343 kB
    • Mimarlik.xml311 kB
    • Biyoloji.xml206 kB
    • Hayvancilik.xml307 kB
    • Felsefe.xml240 kB
    • Borsa.xml174 kB
    • Egitim Bilimleri.xml290 kB
    • Ekonometri-iibf.xml233 kB
    • Gida Muhendisligi.xml298 kB
    • Kutuphanecilik.xml242 kB
    • Dilbilim.xml223 kB
    • Tarihhh.xml280 kB
    • Antropoloji ve Turkiyat Arastirmalari.xml217 kB
    • Isaret Isleme-SIU2009-2011-2012-2005-2008.xml675 kB
    • Elektronik Iletisim-SIU2009-2011-2012-2005-2008.xml189 kB
    • Hukuk.xml275 kB
    • Cografya.xml279 kB
    • Turizm.xml338 kB
    • Iletisim.xml356 kB
    • Endustri Muhendisligi.xml274 kB
    • Dini Arastirmalar.xml218 kB
    • Ekonomi.xml266 kB
    • Spor Bilimleri.xml350 kB
    • Sosyoloji.xml309 kB
    • Eczacilik.xml248 kB
    • Siyasal Bilimler.xml231 kB
    • Jeoloji.xml406 kB
    • Makina Muhendisligi.xml264 kB
    • Arkeoloji.xml1 MB
    • Biyomedikal.xml274 kB
    • Insaat Muhendisligi.xml258 kB

Show simple item record