Yardım:İçindekiler

TRUBA Wiki Sayfası sitesinden

Git ve: kullan, ara

Sıkça Sorulan Sorular


Kullanıcılar tarafından sıklıkla sorulan bazı soruları ve cavaplarını aşağıda ulabilirsiniz. Aşağıda cavabını bulamadığınız sorularızı grid-teknik@ulakbim.gov.tr adresne iletebilirsiniz.

Konu başlıkları

Kullanıcı arayüzü suncularına erişim kısıtlamaları varmı?

Evet. Kullanıcı arayüzü sunucularına erişim için, kullandığınız bilgisayarın IP adresini bildirmeniz ve bu IP adresine bağlantı izni verilmesi gerekir. Bildirilecek IP adresi sadece ilgili kullanıcı tarafından kullanılan bilgisayara atanmış, başka bilgisayarlar tarafından ortaklaşa kullanılmıyor olmalı.

Kullanıcı arayüzü sunucularına sabit IP'si olmayan bilgisayarlarla bağlanılabilir mi?

Evet. Kişisel bilgisayarınıza OpenVPN programını kurup, programı wiki.truba.gov.tr adresinde anlatıldığı şekilde yapılandıradak, herhangi bir ip kısıtlaması olmadan, dünyanın herhangi bir yerinden kullanıcı arayüzü sunucularına erişmek mümkündür.

Kullanıcı arayüzü sunucularına bağlanamıyorum, sorun nerede olabilir?

Sisteme bağlanamamanızın pek çok sebebi olabilir. Olası bazı sebepler:

  • Bağlanırken kullandığınız bilgisayarın IP adresini bize bildirmemiş olabilirsiniz.
  • Kullandığınız bilgisayardaki virus tarama ve firewall benzeri programlar bağlantınızı engelliyor olabilir. Bu programları yeniden yapılandınız, yada iptal ediniz.
  • Kullandığınız bilgisayarın IP'si değişmiş olabilir.
  • Bulunduğunuz networkde SSH veya OpenVPN bağlantılarına izin verilmiyor olunabilir.
  • Bulunduğunuz networkte bir problem yaşanıyor olunabilir.
  • TRUBA networkünde bir problem yaşanıyor olunabilir.

OpenVPN'e bağlanabiliyorum, ancak kullanıcı arayüzü sunucusuna bağlanamıyorum, neden?

OpenVPN programını Windows bilgisayarlar üzerinde çalıştırıken yönetici hakları işe çalıştırmak, linux tabanlı bilgisayarlarda ise root hakları ile çalıştırmak gerekir.

OpenVPN'e bağlıyım, ancak bağlantım sürekli kesiliyor, yeniden bağlanmak zorunda kalıyorum

Bu problem, bir başka OpenVPN bağlantınız varken, başka bir bilgisayardan aynı sertifika ile OpenVPN'e bağlanılmaya çalışıldığında ortaya çıkar. OpenVPN ile bağlanıldığında sunucu diğer bilgisayar üzerindeki bağlantıyı otomatik olarak koparır. Bağlantısı kesilen OpenVPN istemcisi otomatik olarak tekrar bağlanmaya çalışır, ve sisteme bağlanır. Bu durumda sunucu diğer istemcinin bağlantısını koparır. Bu böylece devam eder. sorunu çözmek için diğer bilgisayardaki OpenVPN programının kapatılması gerekir.

OpenVPN bağlantısı yapamıyorum, her 5 saniyede program yeniden bağlanmaya çalışıyor

Büyük ihtimal sertifikanızın geçerlilik süresi dolmuştur. Kullandığınız sertifika yönetici programından, yada sertifikanızı yedeklediğiniz web tarayıcıdan sertifikanızın geçerlikil süresini kontrol ediniz. Sertifikanızın süresi dolmuş ise, daha önce sertifika başvurusu için size gönderilmiş olan e-postadaki sertifika başvuru linkine tıklayarak yeniden sertifika talebinde bulunabilirsiniz.

Sertifikamın geçerlilik süresini nasıl öğrenebilirim?

Sertifika başvurusu sırasında kullandığınız web tarayıcının "Sertifikalar" kısmında sertifikanıza ait detaylı bilgilere ulaşabilirsiniz.

Firefox için : Araçlar-Seçenekler->Gelişmiş->Sertifikalar->Sertifikaları Göster->Kişisel Sertifikalar Chorme için  : Ayarlar ->Gelişmiş Ayarlar -> HTTPS/SSL (Sertifikaları Yönet)

Sertifika başvurusunu nereden yapabilirim?

TRGrid CA tarafından onaylanmış sertifikaya ihtiyaç duyan araştırmacılarımız https://www.grid.org.tr/servisler/sertifika/cert_request/sertifika_basvuru.php bağlantısını kullanarak sertifika başvurusunda bulunabilirler.

Sertifikamı Nerede Kullanabilirim?

Sertifika kullanım alanları aşağıdaki gibi özetlenebilir:

  • Uluslararası projelerde kişisel olarak yetkilendirme
  • TRUBA kaynaklarına erişim için OpenVPN aracılığı ile yetkilendirme
  • Uluslararası araştırma projelerinin web sayfalarına erişim için

Yeniden Sertifika Başvurusu Ne Zaman ve Nasıl Yapılır?

Tüm araştırmacılara ve servislere verilen sertifika süresi 1(bir) yıldır. Önceki başvuruyu ne zaman yaptığınızı hatırlamııyorsanız, kullanıdığınız web tarayıcının sertifikalar gölümünden, sertifikanızın geçerlilik süresini öğrenebilirsiniz.

Eğer sertifilanızın süresi dolduysa, ca@grid.org.tr e-posta adresi ile iletişim kurarak sertifikanızın yenilenme sürecini başlatabilirsiniz. Yada hala saklıyorsanız, daha önce sertifika başvurusu için ca@grid.org.tr adresinden gönderilmiş e-postadaki başvuru linkine tıklayarak yeni sertifika başvurusunda bulunabilirsiniz.

Sertifikamı yüklemeye çalıştığımda şu hatayı alıyorum: "This personal certificate can't be installed because you do not own the corresponding private key which was created when the certificate was requested."

Sertifika başvurusu yapıldığı sırada, sertifika başvurunu yaptığınız bilgisayar ve kullandığınız tarayıcı program (browser: firefox, chrome gibi) içerisinde gizli ve açık anahtar çifti oluşturulmaktadır. Gizli anahtar ilgili tarayıcı programi dolayısıyla kullandığınız bilgisayar içerisine kaydedilmektedir. Açık anahtar ise, TR-Grid CA tarafından imzalanmak üzere web arayüzünden bize gönderilmektedir.

Sertifikanız imzalanarak tarafınıza gönderildiğinde, ilgili sertifikayı .p12 uzantılı kaydedebilmek için imzalanarak size gönderilen sertifika içerisindeki açık anahtar ile tarayıcı programınız tarafından saklanan gizli anahtarın eşleşmesi gerekmektedir. Bu sebeple size gönderilen bağlantıdaki sertifikanızı, ancak ve ancak başvuru yaptığınız bilgisayar ve üzerindeki başvuru sırasında kullandığınız tarayıcı program ile bağlantıya erişmek istediğinizde kaydedebilirsiniz.

"This personal certificate can't be installed because you do not own the corresponding private key which was created when the certificate was requested." hatasını alıyorsanız, yukarıda belirtilen teknik sebepten dolayı, bağlantıyı açmak için kullandığınız tarayıcı tarafında gizli anahtarınıza erişim sağlanamamaktadır.

Bu durumda, lütfen sertifika başvurusu sırasında kullandığınız bilgisayar ve tarayıcı programla size gönderilen bağlantıyı açtığınızdan emin olunuz.

Eğer sertifikanız ile gizli anahtarınızı eşleştiremiyorsanız, lütfen konuyu ca@grid.org.tr e-posta adresine bildirerek, yeniden sertifika başvurusu yapınız.


Kullanıcı arayüzü sunucusundan diğer sunculara geçiş yapamıyorum.

Sadece kullanıcı arayüzü sunucuları, kullanıcıların doğrudan erişimine açıktır. Kullanıcılar işlerini kuyruk sistemi arcılığı ile, kullanıcı arayüzü sunucuları üzerinden kuyruk sistemine göndermelidirler.

Kullanıcı arayüzü sunucusunda çalıştırdığım işler sonlanıyor, neden?

Kullanıcı arayüzü sunucuları üzerinde sadece derleme, ve az kaynak isteyen kısa süreli işler çalıştırılmalıdır. Asıl işler, iş kuyruklarına gönderilmelidir.

Tüm kullanıcılar kullanıcı arayüzleri üzerinden sisteme bağlı olduklarından, bu sunucuları yoracak veya uzun süreli veya çok kaynak gerektiren işlerin çalıştırılması kullanıcıların sunucuya bağanmasını ve kuyruk sistemine iş göndermesini zorlaştırcaktır.

Kullanıcı arayüzü sunucusunda çalıştırılan, uzun süren yada sistemin çalışmasını yavaşlatan işler sistem yöneticisi tarafından sonlandırılır. Bu şekilde çalışmakta ısrar eden kullanıcıların hesapları askıya alınır.


Kuyruğa göderdiğim işlerin err dosyalarında “task/cgroup: plugin not compiled with hwloc support, skipping affinity.” şeklinde hata mesajı alıyorum.

Bu bir uyarı mesajı niteliğinde olup, işin çalışmasına herhangi bir etkisi yoktur. Göz ardı ediniz.

Squeue yada sbatch komutunu çalıştırdığımda, “squeue: error: slurm_receive_msg: Socket timed out on send/recv operation slurm_load_jobs error: Socket timed out on send/recv operation ” şeklinde bir mesaj alıyorum, neden?

Sistemin yogun kullanıldığı zamanlarda geçici olarak network sıkıntıları yaşanabiliyor, böyle bir sıkıntının yaşandığı anda sbatch/squeue komutunu çalıştırırsanız bu uyarı ile karşılaşabilirsiniz. Bir süre daha bekleyip tekrar deneyiniz, herhangi bir düzelme olmazsa teknik birime e-posta gönderiniz.

Fazla ne kadar kaynak kullanabilirim?

Standart kullanıcılar için tanımlanan en fazla çekirdek sayısı 96'dır. Bu sayı sistemin yoğunluğuna göre dönem dönem arttırılabilir yada azaltılabilir. Bu sayı kaynak olduğu müddetçe kullanılabilecek rakamı belirtir. Kullanıcının her an bu miktardaki kaynağı kullanabileceği garanti değildir.

ARDEB destekli bir proje kapsamında çalışmalarını yürüten bir kullanıcı, standart kullanıcı için tanımlanmış kaynak miktarının yanında, projesi kapsamında tanımlanmış miktar kadar kaynak kullanabilir.

Levrek kümesinden Lüfer kümesindeki dosyalarıma ulaşamıyorum

Levrek Kümesinde ev ve yazılım dizinlerş /truba dosya sisteminde bulunmaktadır. Lüfer kümesinde ise ev dizinleri /home_palamut (/home_palamut1 /home_palamut2 ve /home_eymir) dosya sisteminde bulunmaktadır. Yakın tarihte tüm kullanıclar /truba dosya sistemine geçirilerek /home_palamut dosya sistemi kapatılacaktır. Bu nedenle kullanıcılar önemli verilerini ivedilikle /truba/home da bulunan ev dizinlerine taşımalıdırlar. Ancak Levrek kümesindeki hiç bir sunucunun eski dosya sistemine (/home_palamut) erişimi bulunmamaktadır. Tersi Lüfer kümesi için de geçerlidir. Ancak her iki kümenin de /truba_scratch dosya sistemine erişimi bulunmaktadır. Kullanıcılar taşımak istedikleri verilerini /truba_scratch 'deki dizinine atarak kümeler arasında dosya transferi yapabilir.

Bir diğer metod ise, lufer1 sunucusu ile levrek1 sunucusu arasında SCP ile dosya kopyalamak olabilir.

Lufer1 ve Levrek1 sunucusu arasında SCP ile dosya/dizin kopyalamak

Lufer1 sucucu üzerinden ev dizininizdeki herhangi bir dosya yada dizini aşağıdaki komutla Levrek kümesindeki ev dizininize kopyalayabilirsiniz.

 $> cd
 $> scp -r KAYNAK_DIZIN levrek1:~/

yada

 $> scp -r /home_palamut2/kullanici_adi/KAYNAK_DIZIN kullanici_adi@levrek1/truba/home/kullanici_adi/

ayrıntılı bilgi için

$> man scp

Ev dizinime dosya kopyalayamıyorum, neden?

Disk kotanızı doldurmuş olabilirsiniz. Standart kullanıcılar için disk kotası 100GB kadardır. ARDEB destekli bir proje kapsamında çalışmalarını yürüten kullanıcılar için, farklı kota tanımları mevcuttur.


Disk kotamı nasıl görürüm?

Lüfer1 yada levrek1 sunucusu üzerinde “quota” komutunu çalıştırarak ilgili dosya sistemlerindeki ev dizini kotalarınızı ve kullanım durumunuzu görebilirsiniz.


Parolamı nasıl değiştiririm?

Sisteme login olduktan sonra passwd komutu ile parolanızı değiştirebilirsiniz.

Diğer kullanıcılar verilerime ulaşabiliyorlar, nasıl engellerim?

Kullanıcı dizinleri oluşturulurken, sadece ilgili kullanıcının erişebileceği erişim hakları ile açılmaktadır. Ancak bazı kullanıcılar zamanla diğer kullanıcılarla veri paylaşmak vs. gibi sebeplerle ev dizinlerinin erişim izinlerini değiştirebiliyorlar. Dizin erişim hakkaları “chmod 700 $HOME” komutu ile eski haline getirilebilir.


İşlerim tekrar tekrar en baştan başlıyor neden?

İşin çalıştığı esnada, işin çalıştığı sunucuda meydana gelen bir aksaklı nedeni ile işin durudulması durumunda, iş sistem tarafından tekrar kuyruğa gönderilir. İşin tekrar kuyruğa gönderilmesi istenmiyorsa, betik dosyasına ==“#SBATCH –no-requeue”== satırı eklenmelidir.


Bazı e-postalarım cevaplanmıyor, e-postaları okuyor musunuz?

grid-teknik@ulakbim.gov.tr adresine gönderilen tüm e-postalar okunmaktadır. E-postada belirtilen şikayet konusu genel bir soruna işaret ediyor, ve üzerinde çalışılıyorsa, sorun düzeltildikten sonra, sorunun giderildiğine dair kullanıcıya herhangi bir geri dönüş yapmıyoruz. Kullanıcı sayısı ve aynı genel sorun için gönderilen e-posta sayısı göz önüne alındığında, her kullanıcıya geri dönüş yapılması mümkün görünmüyor.

E-postada belirtilen sorun, sadece o kullanıcı ile ilgili ise, sorun ilgilenilmek üzere sıraya alınıyor. Ancak bazı durumlarda sıranın ilgili soruna gelmesi zaman alabiliyor. Geri dönüş e-postasının gönderilmesi zaman alabiliyor.

Bazı durumlarda, e-posta gözümüzden kaçabiliyor. Sorunun e-posta ile bildirilmesine rağmen bir süre içinde sorun giderilmemiş olursa, bir hatırlatma e-postası daha gönderiniz.

Bana aynı anda XX çekirdeğe kadar kullanabileceğim söylenmesine rağmen kuyrukta neden çok uzun süreler boyunca bekliyor?

İşlerin kuyrukta beklemesinin temelde iki nedeni olabilir. Ya size izin verilen işlemci sayısının tamamını kullanmaktasınız, Ya da gönderdiğiniz kuyrukta işinizin başlaması için yeterli kaynak yoktur. Sinfo komutu ile boş kuyrukları kontrol ederek işlerinizi boş kuyruklara yeninden gönderebilir, Ya da kuyrukta bekleyen işlerinizi scontrol komutu ile boş olan bir kuyruğa yönlendirebilirsiniz.


Derlediğim uygulamalar bazı neden kuyruklarda çok hızlı çalışıyorken bazılarında çok yavaş çalışıyor?

Kuyruklarda kullanılan donanımlar arasında işlemci, bellek ve nesil farkı bulunmakta. Mercan/Lufer suncuularında AMD işlemciler bulunurken Levrek sunucularında Intel işlemciler bulunmaktadır. Sunucuların performasları da aynı değildir. Dolayısı ile işlerin farklı hızlarda çalışması normaldir. Ancak donanım performansından ayı olarak bir performans sıkıntısı yaşanıyor ise, yapılan derleme sisteme uygun olarak yapılmamış olabilir. Uygulamanın çalışacağı işlemci markasına göre, uygulamanızı o işlemci için TUNE edilmiş kütüphanelerle derlemekte fayda vardır. Özellikle blas,lapack,blacs,scalapack,fftw gibi kütüphanelerin kullanıldığı uygulamalarda tune edilmiş kütüphaneler büyük farklılıklar yaratabilir.


Kullandığım parallel uygulamanın performansını arttırmak için ne yapabilirim?

Kullanmak istediğiniz çekirdek sayısı tek bir sunucu tarafından karşılanabiliyorsa, işlerinizi farklı sunuculara dagıtmak yerine tek bir sunucu üzerinde çalıştırmak genelde daha iyi sonuç verir.


Hangi tür paralelleştirme daha başarılıdır: MPI mı OpenMP mi?

Bu uygulamanın yaptığı işe, kodun kalitesine ve daha pek çok paramereye bağlı olmakla birlikte, OpenMP (sunucu içi paralelleştirme) türü paralelleştirme, MPI (sunucular arası paralelleştirme -Message Passing Interface) türü paralellleştirmeye nazaran daha başarılıdır.


Sistemde hazır bulunan uygulamalar benim derlediklerimden neden yavaş çalışıyor?

Sistemde bulunan uygulamalar, buradaki ekip tarafından standar özelliklerle ve mümkün olan en fazla kullanıcın işine yarayacak şekilde derlenilmeye çalışılmıştır. Hesaplarınızda kullanılan hesap türü için farklı derleme parametreleri, farklı optimizasyonlar gerekiyor olabilir. Bu nedenle aslında tüm kullanıcıların kendi derlemelerini kendilerinin yapmasını şiddetle tavsiye ediyoruz.


Sunucu başına en fazla ne kadar GPU kullanabilirim.

GPU kartları levrek kümesindeki bazı sunuculara takılmıştır. 16 sunucuda sunucu başına 2'şer adet Nvidia M2090 model GPU kart bulunmaktadır. Ayrıca levrek1 suncusunda 2 adet Nvidia C1060 model GPU kartı bulunmaktadır.

Tek çekirdekli işlerim çalışıyorken çok çekirdekli/çok nodlu işlerim çalışmıyor

Paralel işlerin çalışabilmesi için nodelar arasında kullanıcın şifresiz geçiş yapabiliyor olması gerekmektedir. Şifresiz geçiş için SSH anahtar mekanizması kullanılır. Bu ğeçiş için SSH anahtarlarının ve yapılandırmasının yapılmış olması gerekir. Ayrıntılı bilgi için Kullanıcı Hesabının Kullanılır Duruma Getirilmesi başlıklı maddeyi inceleyiniz.

Sistemde IDLE node ve Idle çekirdek olmasına rağmen kuyrukta bekleyen işim neden çalışmıyor?

Herhangi bir anda sistemde IDLE node yada çekirdek bulunması, ilgili node yada çekirdeğin o anda sizin işiniz tarafından kullanılabileceği anlamına gelmemektedir. IDLE node yada çekirdekler, sizin işinizden önce gönderilen yada önceliği sizin işinizden daha yüksek olan işlere yeterli kaynak oluşturmak için bekletiliyor olunabilir.


İşlerin daha çabuk başlaması için ne yapabilirim?

İşleri kuyruğa gönderirken --time parameresi ile işin tahmini çalışma zamanını bildirmek zorunludur.. Aksi halde işler 2 dakika içinde sistem tarafından sonlandırılmaktadır. Ancak kullanıcıların çoğu, zaman bilgisini verirken, iş çok daha kısa zamanda sonlanabilecekken bile, iş için verilebilecek en fazla zamanı vermekdedirler. İşler planlanırken backfill algoritması kullanılmaktadır. Bu algoritmaya göre, önceliği düşük olan veya yeni gönderilmiş işler bile, önceliği yüksek olan ve çok çok önce gönderilmiş işlerden daha çabuk başlayabilir. Çünkü algoritma, suncuların iş takvimlerini kullanıcıların vermiş oldukları --time bilgisine göre oluşturarak, arada kalan boş zamanlara, o zaman sığacak işleri planlamaktadır.

Bu nedenle işler sıraya gönderilirlen işin çalışması için yeterli, mümkün olan en kısa zaman ile işin sıraya gönderilmesi işlerin çok daha hızlı bir şekilde başlamasını sağlamaktadır.

Hesaplama kuyruklarındaki donanımların kullanım durumlarını nasıl görebilirim?

sinfo komutu ile kümelerin anlık kullanım durumlarını görebilir, işinizi buna göre boş olan kümelere gönderebilir, yda kuyrukta bekleyen işlerinizi bı boş kümelere yönlendirebilirsiniz. Aşağıdaki komutları da denemenizi öneririm.

sinfo -o  ”%P %C ”
sinfo -o  ”%n %C “

İşlerim AssociationJobLimit veya AssocGrpCPUMinutesLimit uyarısı vererek başlamıyor

Hesabınız için tanımlanmış olan çekirdek-saat kotasının tamamını kullanmış olduğunuz için, işleriniz iş kuyruğuna alınmasına rağmen başlamaz.. İşlerinizin başlayabilmesi için çekirdek-saat kotanızın arttırılması gerekir.. TRUBA kaynaklarını kullanarak şu ana kadar yapmış olduğunuz, ve talep edeceğiniz ek kaynakla yapmak istediğiniz çalışmalar hakkında özet bilgi ve bu çalışmalar sonunucunda hazırladğınız tez, bildiri, makale vs. yayınların listesini gönderirseniz, kaynak talebiniz değerlendirilerek bir uzatma sağlanabilir.

Kişisel araçlar