NAME

Quiq::String - Operationen auf Zeichenketten

BASE CLASS

Quiq::Object

METHODS

Encoding

autoDecode() - Auto-dekodiere Zeichenkette

Synopsis

$str = $class->autoDecode($str);
$str = $class->autoDecode($str,$otherEncoding);

Description

Analysiere Zeichenkette $str hinsichtlich ihres Character-Encodings und dekodiere sie entsprechend. Unterschieden werden:

  • ASCII

  • UTF-8

  • UTF-16/32 mit BOM

und $otherEncoding. Ist $otherEncoding nicht angegeben, wird ISO-8859-1 angenommen.

Einrückung

indent() - Rücke Text ein

Synopsis

$str2 = $class->indent($str,$indentStr,@opt);
$class->indent(\$str,$indentStr,@opt);

Options

-indentBlankLines => $bool (Default: 0)

Rücke auch Leerzeilen ein. Per Default werden nur Zeilen mit wenigstens einem Zeichen eingerückt.

Diese Option ist nützlich, wenn die Funktion zum Auskommentieren genutzt werden soll.

-strip => $bool (Default: 0)

Entferne Newlines am Anfang und Whitespace am Ende. Per Default geschieht dies nicht.

Description

Rücke den Text $str um Zeichenkette $indentStr ein und liefere das Resultat zurück.

Die Einrück-Zeichenkette $indentStr wird jeder Zeile von $str hinzugefügt, außer Leerzeilen.

Example

  • Texteinrückung um vier Leerzeichen

    $class->indent($txt,' ' x 4);
    
    |Dies ist                   |    Dies ist
    |ein Test-   - wird zu ->   |    ein Test-
    |Text.                      |    Text.

determineIndentation() - Einrücktiefe eines Textes

Synopsis

$n = $class->determineIndentation($str);

Description

Ermittele die Einrücktiefe des Textes $str und liefere diese zurück. Die Einrücktiefe ist der größte gemeinsame Teiler aller Zeilen-Einrückungen. Beispiel:

|Dies
|    ist
|       ein
|           Test

Einrücktiefe ist 4.

WICHTIG: Für die Einrückung zählen nur Leerzeichen, keine Tabs!

reduceIndentation() - Reduziere Einrücktiefe eines Textes

Synopsis

$str = $class->reduceIndentation($n,$str);
$class->reduceIndentation($n,\$str);

Description

Reduziere die Einrücktiefe des Textes $str auf Tiefe $n.

Example

Text:

|Dies
|    ist
|        ein
|            Test

Reduktion auf Einrücktiefe 2:

Quiq::String->reduceIndentation(2,$str);

Resultat:

|Dies
|  ist
|    ein
|      Test

removeIndentation() - Entferne Text-Einrückung

Synopsis

$str = $class->removeIndentation($str,@opt); # [1]
$class->removeIndentation(\$str,@opt);       # [2]

Options

-addNL => $bool (Default: 0)

Nach dem Entfernen aller NEWLINEs am Ende füge ein NEWLINE hinzu.

Description

[1] Entferne Text-Einrückung aus Zeichenkette $str und liefere das Resultat zurück.

[2] Wird eine Referenz auf $str übergeben, wird die Zeichenkette "in place" manipuliert und nichts zurückgegeben.

  • NEWLINEs am Anfang werden entfernt.

  • Whitespace (SPACEs, TABs, NEWLINEs) am Ende wird entfernt. Das Resultat endet also grundsätzlich nicht mit einem NEWLINE.

  • Die Methode kehrt zurück, wenn $str anschließend nicht mit wenigstens einem Whitespace-Zeichen beginnt, denn dann existiert keine Einrückung, die zu entfernen wäre.

  • Die Einrückung von $str ist die längste Folge von SPACEs und TABs, die allen Zeilen von $str gemeinsam ist, ausgenommen Leerzeilen. Diese Einrückung wird am Anfang aller Zeilen von $str entfernt.

  • Eine Leerzeile ist eine Zeile, die nur aus Whitespace besteht.

Example

  • Einrückung entfernen, Leerzeile übergehen:

    |
    |  Dies ist
    |              <- Leerzeile ohne Einrückung
    |  ein Test-
    |  Text.
    |

    wird zu

    |Dies ist
    |
    |ein Test-
    |Text.
  • Tiefere Einrückung bleibt bestehen:

    |
    |    Dies ist
    |  ein Test-
    |  Text.
    |

    wird zu

    |  Dies ist
    |ein Test-
    |Text.

removeIndentationNl() - Entferne Text-Einrückung

Synopsis

$str = $class->removeIndentationNl($str,@opt); # [1]
$class->removeIndentationNl(\$str,@opt);       # [2]

Kommentare

removeComments() - Entferne Kommentare aus Quelltext

Synopsis

$newCode = $this->removeComments($code,$start);
$newCode = $this->removeComments($code,$start,$stop);

Description

Entferne alle Kommentare aus Quelltext $code und liefere das Resultat zurück. Die Kommentarzeichen werden durch die Parameter $start und $stop definiert. Siehe Abschnitt Examples.

Die Methode entfernt nicht nur die Kommentare selbst, sondern auch nachfolgenden oder vorausgehenden Whitespace, so dass kein überflüssiger Leerraum entsteht.

Im Falle von einzeiligen Kommentaren (d.h. nur $start ist definiert), wird vorausgesetzt, dass dem Kommentarzeichen (der Kommentar-Zeichenkette) im Quelltext zusätzlich ein Leerzeichen oder Tab vorausgeht, sofern es nicht am Anfang der Zeile steht. D.h.

my $ind = ' ' x 4; # Einrückung
                  ^ ^
                  hier müssen Leerzeichen (oder Tabs) stehen

my $ind = ' ' x 4;# Einrückung
                  ^
                  Wird nicht erkannt!

my $ind = ' ' x 4; #Einrückung
                   ^
                   Wird nicht erkannt!

Im Falle von mehrzeiligen Kommentaren ($start und $stop sind definiert) ist dies das vorausgehende Leereichen nicht nötig.

Examples

HTML, XML:

$code = Quiq::String->removeComments($code,'<!--','-->');

C, Java, CSS:

$code = Quiq::String->removeComments($code,'/*','*/');

C++, JavaScript:

$code = Quiq::String->removeComments($code,'//');

Shell, Perl, Python, Ruby, ...:

$code = Quiq::String->removeComments($code,'#');

SQL:

$code = Quiq::String->removeComments($code,'--');

Umbruch

wrap() - Umbreche Fließtext

Synopsis

$text = $class->wrap($text,@opt);

Options

-width => $n (Default: 70)

Maximale Zeilenbreite des resultierenden Fließtextes (sofern kein einzelnes Wort länger als die Zeilenbreite ist).

Description

Umbreche Fließext $text, so dass die Zeilenlänge $width möglichst nicht überschritten wird. Sie kann überschritten werden, wenn ein Wort länger als $width ist, sonst ist die Zeilenlänge <= $width.

Whitespace:

  • Whitespace am Anfang und am Ende von $text wird entfernt

  • Folgen von Whitespace-Zeichen innerhalb von $text werden zu einem Whitespace-Zeichen reduziert

Paragraphen:

Ist der Text in Paragraphen organisiert und soll dies erhalten bleiben, muss jeder Paragraph einzeln umbrochen werden.

Example

Maximale Zeilenlänge auf 12 Zeichen begrenzen:

$txt = "Dies ist ein Test mit einem kurzen Text.";
$txt = Quiq::String->wrap($txt,-width=>12);
# =>
Dies ist ein
Test mit
einem kurzen
Text.

VERSION

1.140

AUTHOR

Frank Seitz, http://fseitz.de/

COPYRIGHT

Copyright (C) 2019 Frank Seitz

LICENSE

This code is free software; you can redistribute it and/or modify it under the same terms as Perl itself.