[Résolu] Supprimer les balises HTML et ne garder que le texte ?
Stagiaire WDF
Inscrit:
31/01/2007 23:48
Post(s): 23
Bonjour.

J'ai cherché rapidement mais je n'ai pas trouvé le moyen de supprimer les balises html d'une page html afin de ne garder que le texte. Je voudrais faire l'inverse de la fonction texteVersHtml en fait.

Quelqu'un a t-il une astuce qui m'évite de tout coder à la main ?

Merci d'avance.

Contribution le : 26/03/2007 16:38

Edité par drcharly93 sur 28/3/2007 9:57:24
Créer un fichier PDF de la contribution Imprimer


Re: Supprimer les balises HTML et ne garder que le texte ?
Animateur WDF
Inscrit:
02/03/2003 04:07
De Noisy le grand(93)
Post(s): 2745
Bonjour,

Une solution simple:
Utiliser via les objet automation le serveur com qui permet de piloter Internet Explorer
Ligne 1 : instantation de l'objet com
Ligne 2 : on lui passe la page HTML
Ligne 3 : On récupère le texte de la page.
oIE est un objet Automation "InternetExplorer.Application"
oIE>>Navigate2("www.pcsoft.fr")
str est une chaîne = oIE>>document>>body>>innerTEXT

Contribution le : 26/03/2007 17:07
_________________
@A+
Contact (privé)......
email : drcharly@wdforge.org
[DrCharly93]
Créer un fichier PDF de la contribution Imprimer


Re: Supprimer les balises HTML et ne garder que le texte ?
Animateur WDF
Inscrit:
19/01/2004 13:48
De www.sigmasys.fr
Post(s): 988
Autre solution, une procédure qui convertit le HTML en Texte. La procédure suivante convertit le HTML en texte mais garde les balises concernant la couleur du texte, donc à adapter suivant vos besoins :

PROCEDURE Gbl_HTMLVersTexte(_TexteHTML)
//*** Procédure permettant de récupérer le texte d'une chaine HTML avec gestion de la couleur ***//
chTexte est une chaîne
chTemp est une chaîne
i est un entier
j est un entier
bDebutBalise est un booléen = Faux
ePosDebutBalise est un entier = 0
ePosRecherche est un entier
chCouleurTexte est une chaîne = ""

chTexte = Remplace(_TexteHTML,"<br />",RC)		//Support du XHTML

i = Position(chTexte,"<")
TANTQUE i>0
	bDebutBalise = Vrai
	ePosDebutBalise = i
	chTemp = ExtraitChaîne(chTexte[[ i A ]], 1, ">")
	
	SELON Gauche(chTemp,6)
		CAS "<font " :
			ePosRecherche = Position(chTemp," color=")
			SI ePosRecherche>0 ALORS
				chCouleurTexte = "###"+ chTemp[[ (ePosRecherche + 8) A (ePosRecherche + 13) ]] + "##"
			SINON
				chCouleurTexte = ""
			FIN
			
		CAS "</font" :
			chCouleurTexte = ""
		AUTRES CAS :
			chCouleurTexte = ""	
	FIN
	
	ePosRecherche = Position(chTexte,">", i)
	SI ePosRecherche>0 ALORS
		SI ePosDebutBalise>1 ALORS
			chTexte = Milieu(chTexte,1, ePosDebutBalise - 1) + "$$$" + chCouleurTexte + Milieu(chTexte, ePosRecherche + 1) 
		SINON
			chTexte = chCouleurTexte + Milieu(chTexte, ePosRecherche+1)
		FIN
		i = 0
		ePosDebutBalise = 0
	FIN

	i = Position(chTexte,"<")
FIN

chTexte = Remplace(chTexte,RC, "<BR>")		//Support du XHTML
chTexte = Remplace(chTexte,"###","<FONT COLOR=#")
chTexte = Remplace(chTexte,"##",">")
chTexte = Remplace(chTexte,"$$$","</FONT>")


RENVOYER chTexte


Bon dév.,

Totof

Contribution le : 27/03/2007 00:59
_________________
[ Totof(Christophe LOGEL) réalise des développements spécifiques WinDev (Mon annonce wdforge), http://www.sigmasys.fr]
Créer un fichier PDF de la contribution Imprimer


Re: Supprimer les balises HTML et ne garder que le texte ?
Stagiaire WDF
Inscrit:
31/01/2007 23:48
Post(s): 23
Merci à vous deux.

J'avais déjà pensé à la solution de DrCharly93 (à la différence que je compter utiliser l'activeX et non l'objet automation) mais je vais tester les deux méthodes et voir celle qui donne les meilleurs résultats.

Contribution le : 27/03/2007 16:37
Créer un fichier PDF de la contribution Imprimer



 Haut   Précédent   Suivant




Enregistrer votre réponse
CompteNom   Mot de passe   Authentification
Message:


Vous ne pouvez pas débuter de nouveaux sujets.
Vous pouvez voir les sujets.
Vous ne pouvez pas répondre aux contributions.
Vous ne pouvez pas éditer vos contributions.
Vous ne pouvez pas effacez vos contributions.
Vous ne pouvez pas ajouter de nouveaux sondages.
Vous ne pouvez pas voter en sondage.
Vous ne pouvez pas attacher des fichiers à vos contributions.
Vous ne pouvez pas poster sans approbation.

[Recherche avancée]


Connexion
Menu
Chercher WDForge
Chercher Web
Partenaires
Visualiser tous les Partenaires...
WinDev, WebDev, WinDev Mobile et HyperFile sont des marques déposées par PCSoft. |  Voter |  Legal |  Contact |   XOOPS 2.0.13.2