Site des Oraux

Bio-informatique 2006 (4) :: post
Années :: Toutes

Post nº4 (id2496) envoyé par anonyme  le 22 Dec 2006, 12:19
Mes réponses sont indiquées entre ().

PARTIE PRATIQUE (il manque surement certaines petites question, je retape tout de mémoire ) :

Question A)
Il était donné un numéro d'accession : U02616 dans la banque NCBI.
- Trouver le type de molécule (ARNm)
- Longueur (726pb)
- Espèce (Musca domestica : mouche domestique)
- No d'accession de la protéine codée ( AAA03434, il s'agit d'une glutathione-s-transferase)
- Nombre de résidus (241 aa)

Question B)
A partir de la séquence U02616, trouver une protéine homologue chez la drosophile (DROME). Pour cela, employez blast avec la banque de données par défaut.
-quel version de blast doit on utiliser (blastx : nuc translated against prot)
- que contient la base de données par défaut (défaut était uniprot, qui contient swissprot, TrEMBL et EMBL ORF translated)
- quelle est la protéine de drosophile qui matche le plus avec la séquence U02616 traduite ? (là il fallait regarder les résulats de blast, et prendre la première ligne qui contient "DROME". Attention, il ne s'agissait pas du premier résultat, mais le troisième !!)
- Donnez l'annotation de cette protéine, le pourcentage d'identité ainsi que l'E-value. A partir de ces trois paramètres, concluez quant à l'homologie des deux protéines. (Moi, j'ai remarqué que les noms de protéines étaient les mêmes, il y avait un pourcentage d'identité élevé et une e-value très faible. Ces trois paramètres indiquent qu'elles sont similaires. ATTENTION : même si c'est plus que probable, le fait qu'elles soient similaires n'indique pas qu'elles sont forcément homologues !!!)

Question C)
Reprenez U02616 et appliquez transeq. Comparez ensuite le résultat de transeq à la banque de données pfam à l'aide de ehmmpfam.
- Quels sont les motifs de la banque de données qui sont retrouvés dans la protéine (il y en avait deux)
- L'annotation des motifs est-elle en concordance avec l'annotation de la protéine trouvée dans swissprot à l'exercice B (oui)

PARTIE THEORIQUE :

Nico & Greg (on a eu la mm ) :
Il était donné un espace de séquences avec les scores déjà indiqués dedans.
-Déterminer l'algorithme qui a été appliqué (dans ce cas il y avait des zéros partout dans 1ere ligne et 1ere colonne --> soit algo classique modifié pour éviter pénalités de gap aux extrémités, soit water, cependant il y avait des scores négatifs ds le tableau donc water était à bannir !!!)
-Ecrire l'alignement (faire un backtracing)

Sous questions :
- qu'est-ce qui a été modifié dans l'algorithme classique pour éviter les pénalités de gap aux extrémités ?
- où se trouve le meilleur alignement ? (il faut partir du meilleur score de la dernière colonne ou dernière ligne)
+ quelques petites questions sur d'autres algorithmes, principalement Needle.

Post nº3 (id2495) envoyé par anonyme  le 22 Dec 2006, 12:18
theorie:

j'ai recu un alignement tout fait avec les pénalitésd de déletion , d'insertion et de substitution vraie... on demande le score de DISTANCE et de décider soi même la pénalité de substitution identique
dc pr repondre..
subst identique-> score à 0 comme ca on augmente pas la score (vu qu'on veut le score de distance)
pour le score, on somme les scores de chaque délétion, subst, insertions, et on dit que plus le score est important, plus la distance entre les deux sequences est importante.

J'ai aussi du expliquer l'induction pr remplir l'espace des séquences..

Sous questions:
-pq on a fait fasta et blast?? pcq plus rapide pr comparer à une banque de données

C'est à peu près tout...

Post nº2 (id2494) envoyé par Chucky  le 22 Dec 2006, 12:12
Partie pratique sur ordinateur :
A/ Collectes d'infos sur une protéine
B/ Utilisation du Blast (attention, ici il fallait utiliser BlastX !)
C/ Recherche dans la base de données Pfam, après avoir fait une traduction de l'arn et protéine via transeq.
-> Tout est expliqué sur la feuille, mais il faut chipotter avec les options (pas comme au tp où tout était mis par défaut !). De plus, l'exam était un peu long pour le temps qui nous était imparti. C'était les mêmes questions pour tout le monde

Examen oral :
Etudiant 1 : Il fallait retrouver l'algorithme sans pénalité aux extrémités à partir d'un espace de séquence, et faire un backtracking.
Etudiant 2 : Il fallait expliquer le fonctionnement du même algorithme.
Etudiant 3 : Sais pas
Etudiant 4 : Etablir le profil de 5 séquences de longueur 6 (sans substitutions/délétions) puis établir le modèle d'émission. Il faut dévelloper bcp plus que les 2 questions qu'il a posées. J'ai du expliquer en détail (j'insiste sur détail) ce qu'étaient les chaines de markov, parler des scores, des pseudos counts, ...

Post nº1 (id2204) envoyé par james  le 14 Jun 2006, 23:19
pour nous, chacun rentre toutes les demi heures.
ya une demi heure de préparation (pour toutes les questions) avec notes de cours, pui environ une demi-heure devant chaque prof pour répondre à leurs questions. ensuite, vous allez sur un pc et vous faites l'exo de herzog sur srs et emboss. ya pa vraiment de timing précis sauf pour la prépa, donc à votre aise

mais avec tout ça, j'ai pa encore donné mes questions. les voici:
collet: établissez le profil (d'une suite de séquence) et calculez le score de la xième séquence
expliquez les alignements multiples par méthode hiérarchique en spécifiant comment on peut comparer les scores dans tous les cas
herzog: citer 3 méthodes d'alignements de séquence 2 à 2 et expliquez en 2 + quelle méthode permet de visualiser le mieu une répétition au sein d'une séquence

voila voila

james


oraux.pnzone.net - infos - 41ms